我的知识海洋

What are you following

  • 首页
  • 标签
  • 分类目录
  • 文章归档
  • 行路万里
  • 读书万卷
  • About Me

  • 搜索
面经 解决方案 操作系统 Java源码 开源 GSoC 哲学 中间件 回溯 链表 书 top 数据库 分布式 滑动窗口 配置 动态规划 前缀树 并查集 Redis 总结 年终总结 面试 算法基础

分布式数据库2-什么是分布式数据库

发表于 2021-12-17 | 分类于 学习 | 阅读次数 1006
# 分布式 # 数据库
分布式数据库1-为什么要学习分布式数据库
Steve Jobs:A Biography

如果你想真正得到一些知识,最好过滤一下你的信息,否则你只是在别人的思考中得意着。
获得多少并不取决于读了多少,而取决于思考了多少。
《暗时间》 刘未鹏

此系列学习分布式数据库30讲的笔记,导图是本文结构,具体细节在后文,可用到导图回忆框架,具体细节再具体查看。

文章图片来自极客时间,如有版权问题,请联系我删除。

欢迎加入学习

总结图

分布式数据库2-什么是分布式数据库

两种业务场景

OLTP

  • 联机交易

    • 数据量小、但需要实时给出结果

OLAP

  • 联机分析

    • 数据量大、需要进行分析

OLTP 联机交易特点

写多读少

低延时

高并发

外部视角

定义1.0

  • 满足写多读少、低延时、高并发的数据库

定义2.0

  • 分布式数据库可以满足海量的并发请求
  • “海量并发”的下限大致是 10,000TPS
  • 满足写多读少、低延时、高并发、海量并发的数据库

定义3.0

  • 高可靠性
  • 对金融行业的关键应用系统来说,通常是要求具备 5 个 9 的可靠性(99.999%),也就是说,一年中系统的服务中断时间不能超过 5.26 分钟(3652460*(1-99.999%) ≈ 5.26 )。

如何解决磁盘损坏问题?

  • 可以用RAID(独立冗余磁盘阵列)

  • 但分布式数据库的副本机制可以比 RAID 更好地平衡可靠性、性能和空间利用率三者的关系。副本机制就是将一份数据同时存储在多个
    机器上,形成多个物理副本。

  • RTO

    • 恢复时间目标
      (Recovery Time Objective, RTO)

    • RTO 是指故障恢复所花费的时间,可以等同于可靠性

  • RPO

    • 恢复点目标(Recovery Point Objective,
      RPO)

    • RPO 则是指恢复服务后丢失数据的数量。

  • 分布式数据库是服务于写多读少、低延时、海量并发 OLTP 场景的,高可靠的关系型数据库。

定义 4.0

  • 海量存储
  • 分布式数据库是服务于写多读少、低延时、海量并发 OLTP 场景的,具备海量数据存储能力和高可靠性的关系型数据库

内部视角

以下几种不是产品

  • 客户端组件 + 单体数据库

    • Sharding-JDBC
  • 代理中间件 + 单体数据库

    • MyCat
  • 单元化架构 + 单体数据库

产品理念不同

  • Aurora

分布式数据库是将技术细节收敛到产品内部,以一个整体面对业务应用

分布式数据库2-什么是分布式数据库

# 分布式 # 数据库
分布式数据库1-为什么要学习分布式数据库
Steve Jobs:A Biography

  • 文章目录
  • 站点概览
erdengk

erdengk

91 日志
5 分类
24 标签
RSS
Github E-mail
Creative Commons
友链
  • 星球球友
  • Joey
  • 北松山(itwaix)-TP在职
  • JooKS' Blog-GSoC 2022 Mentor
  • Chever-John-Shein在职
  • 一堆网页小游戏
  • 飞鸟记
0%
© 2019 — 2026 erdengk
由 Halo 强力驱动
陕ICP备2021015348号-1
川公网安备 51011202000481号
轻点广告,请我喝水,非常感谢 (。・ω・。)ノ(*/ω\*)