如果你想真正得到一些知识,最好过滤一下你的信息,否则你只是在别人的思考中得意着。
获得多少并不取决于读了多少,而取决于思考了多少。
《暗时间》 刘未鹏
此系列学习分布式数据库30讲的笔记,导图是本文结构,具体细节在后文,可用到导图回忆框架,具体细节再具体查看。
文章图片来自极客时间,如有版权问题,请联系我删除。
欢迎加入学习
总结图
分布式数据库2-什么是分布式数据库
两种业务场景
OLTP
-
联机交易
- 数据量小、但需要实时给出结果
OLAP
-
联机分析
- 数据量大、需要进行分析
OLTP 联机交易特点
写多读少
低延时
高并发
外部视角
定义1.0
- 满足写多读少、低延时、高并发的数据库
定义2.0
- 分布式数据库可以满足海量的并发请求
- “海量并发”的下限大致是 10,000TPS
- 满足写多读少、低延时、高并发、海量并发的数据库
定义3.0
- 高可靠性
- 对金融行业的关键应用系统来说,通常是要求具备 5 个 9 的可靠性(99.999%),也就是说,一年中系统的服务中断时间不能超过 5.26 分钟(3652460*(1-99.999%) ≈ 5.26 )。
如何解决磁盘损坏问题?
-
可以用RAID(独立冗余磁盘阵列)
-
但分布式数据库的副本机制可以比 RAID 更好地平衡可靠性、性能和空间利用率三者的关系。副本机制就是将一份数据同时存储在多个
机器上,形成多个物理副本。 -
RTO
-
恢复时间目标
(Recovery Time Objective, RTO) -
RTO 是指故障恢复所花费的时间,可以等同于可靠性
-
-
RPO
-
恢复点目标(Recovery Point Objective,
RPO) -
RPO 则是指恢复服务后丢失数据的数量。
-
-
分布式数据库是服务于写多读少、低延时、海量并发 OLTP 场景的,高可靠的关系型数据库。
定义 4.0
- 海量存储
- 分布式数据库是服务于写多读少、低延时、海量并发 OLTP 场景的,具备海量数据存储能力和高可靠性的关系型数据库
内部视角
以下几种不是产品
-
客户端组件 + 单体数据库
- Sharding-JDBC
-
代理中间件 + 单体数据库
- MyCat
-
单元化架构 + 单体数据库
产品理念不同
- Aurora
分布式数据库是将技术细节收敛到产品内部,以一个整体面对业务应用
分布式数据库2-什么是分布式数据库