本文翻译自国外论坛 medium,原文地址:https://medium.com/@interviewready/data-replication-in-distributed-system-87f7d265ff28
数据复制是指将数据复制到一个或多个数据容器以确保可用性的过程。复制的数据通常存储在不同的数据库实例中,即使一个实例发生故障,我们也可以从其他实例获取数据。
一种流行数据复制的实现架构是主从架构。
推荐博主开源的 H5 商城项目waynboot-mall,这是一套全部开源的微商城项目,包含三个项目:运营后台、H5 商城前台和服务端接口。实现了商城所需的首页展示、商品分类、商品详情、商品 sku、分词搜索、购物车、结算下单、支付宝/微信支付、收单评论以及完善的后台管理等一系列功能。 技术上基于最新得 Springboot3.0、jdk17,整合了 MySql、Redis、RabbitMQ、ElasticSearch 等常用中间件。分模块设计、简洁易维护,欢迎大家点个 star、关注博主。
github 地址:https://github.com/wayn111/waynboot-mall
为了理解这个架构,我们举一个例子。
你能注意到这里有什么问题吗?
我们的数据库存在单点故障。如果它崩溃了,我们的整个系统就会停止工作。
为了避免这种单点故障,我们可以使用另一个数据库(最好是不同的数据库实例)来存储原始数据的副本(一般我们成为从库)。现在如果原始数据库(主库)崩溃,我们可以将请求转到从库。
但是我们如何保持从库与主库同步呢?这有两种方法。
这里我们的一般定义是收到写请求的主库数据库是 master)。从库被称为 slaves。
如上图我们的主站也就是 Server2 维护事务日志。他会更新从站中(Server1)的数据,它发送命令,然后从站以相同的顺序执行这些命令。
如果服务器向从站发送写入请求会发生什么?
有两种方法可以处理这种情况
主主架构的问题
网络故障可能会导致主主架构中的数据不一致。
让我们用一个例子来理解这一点,假设我们有两个数据库实例 A 和 B。
现在用户发送以下请求,
由于存在通信故障,A 和 B 无法同步,它们具有不同的数据值,因此不一致。
这个问题被称为裂脑问题。
我们可以通过添加第三个节点(数据库实例)来解决裂脑问题。
这里我们假设一个节点崩溃以及其他两个节点之间的路由器崩溃的可能性极小。
让我们考虑三个数据库实例 A、B 和 C。
这称为分布式共识。多个节点就特定值达成一致。在这种情况下,A、B 和 C 在最终状态上达成一致。
感谢您的阅读,希望本文能对你理解分布式架构中的数据复制有所帮助。
关注公众号【waynblog】每周分享技术干货、开源项目、实战经验、高效开发工具等,您的关注将是我的更新动力!