MongoDB系列-解决面试中可能遇到的MongoDB复制集(replica set)问题

本文涉及的产品
云数据库 MongoDB,独享型 2核8GB
推荐场景:
构建全方位客户视图
简介: MongoDB复制集(replica set):MongoDB复制集维护相同数据集的一组mongod进程,复制集是生产部署的基础,具有数据冗余以及高可用性。

MongoDB复制集(replica set):MongoDB复制集维护相同数据集的一组mongod进程,复制集是生产部署的基础,具有数据冗余以及高可用性。


那为什么要设置复制集(replica set)呢?


  • 由于复制集是通过在不同服务器上保存来副本,可保证数据在生产部署的冗余和可靠性,不会因为单点问题而丢失数据。
  • 可以通过访问不同服务器副本数据来提高数据读取能力,从而提高整个系统的负载能力。


1. 复制集架构原理


副本集包含多个数据节点可选的一个仲裁节点。 而在数据节点中:只有一个主节点(primary node),其他节点为为从节点(secondary nodes)


各个节点成员通过心跳机制进行通信,当主节点与从节点的通信的时间超过配置的electionTimeoutMillis期间(默认为10秒)时,符合条件的从节点要求选举将自己指定为新主节点,群集尝试完成新主节点的选举并恢复正常操作。


22.png


主节点: 副本集只能有一个主节点能够确认写入操作来接收所有写操作,并记录其操作日志中的数据集的所有更改(记录在oplog中)。


oplog: 它保存了修改存储在数据库中的数据的所有操作的滚动记录,MongoDB在主节点服务器上应用数据库操作,然后在主节点服务器的oplog上记录操作,然后从节点成员在异步过程中通过心跳机制从任何其他成员导入oplog并应用这些操作,oplog中的每个操作都是幂等的。所有副本集成员都在local.oplog.rs集合中包含oplog的副本,这允许它们维护数据库的当前状态。


从节点: 复制主节点的oplog并将oplog记录的操作应用于其数据集,如果主节点宕机了,将从符合条件的从节点选举选出新的主节点,。 而且你可以通过配置实现特定的功能,比如:


  • 防止从节点成为选举中的主节点Primary,指定节点优先级。
  • 阻止应用程序从节点读取数据,从而允许应用程序运行需要与正常流量分离的应用程序,隐藏节点。
  • 保留正在运行的“历史”快照,以用于从某些错误中恢复,例如无意中删除的数据库,延迟节点


仲裁节点: 仲裁节点不维护数据集。 仲裁节点的目的是通过响应其他副本集节点的心跳和选举请求来维护副本集中的仲裁。 因为它们不存储数据集,所以仲裁节点可以是提供副本集仲裁功能的好方法,其资源成本比具有数据集的全功能副本集成员更便宜。 如果您的副本集具有偶数个成员,请添加仲裁节点以获得主要选举中的大多数投票。而且仲裁节点总是只有1次选举投票,因此允许副本集具有不均匀的投票成员数,而没有复制数据的额外成员的开销。


23.png


心跳机制(Hearbeat): 复制集成员间默认每2s会发送一次心跳信息,如果10s未收到某个节点的心跳,则认为该节点已宕机不可以访问;如果宕机的节点为Primary,Secondary(前提是可被选为Primary)会发起新的Primary选举。仲裁员与其他集合成员之间的唯一沟通是:选举期间的投票,心跳和配置数据,而且这些交换未加密。


数据同步: 为了维护共享数据集的最新副本,副本的从节点设置同步或复制来自其他节点的数据。 MongoDB使用两种形式的数据同步:初始化同步新节点同步完整的数据集,以及整个集群节点同步后续数据更改。


其中,初始化同步(Initial Sync)过程:


  • 克隆除本地数据库之外的所有数据库。 要进行克隆,mongod会扫描每个源数据库中的每个集合,并将所有数据插入到这些集合的自己的副本中。 初始同步会在为每个集合复制文档时构建所有集合索引。 在早期版本的MongoDB中,在此阶段仅构建_id索引。
  • 初始同步在数据复制期间提取新添加的oplog记录。 确保目标成员在本地数据库中有足够的磁盘空间,以便在此数据复制阶段的持续时间内临时存储这些oplog记录。
  • 将所有更改应用于数据集。 使用来自源的oplog,mongod更新其数据集以反映副本集的当前状态。 初始同步完成后,成员从STARTUP2转换为SECONDARY。


2. 标准复制集架构


标准复制集架构由三台服务器,其中包括三个数据节点(一个主节点、两个从节点)或两个数据节点(一个主节点、一个从节点)和一个仲裁节点两种情况。如下所示:


三个数据节点:


  • 一个主节点;
  • 两个从节点,主节点宕机后,有机会选举成为主节点。


23.png


当主库宕机后,两个从库都会进行竞选,其中一个变为主库,当原主库恢复后,作为从库加入当前的复制集群即可。


24.png


两个数据节点以及一个仲裁节点:


  • 一个主节点;
  • 一个从节点,有机会被选举成为主节点;
  • 一个仲裁节点,只有投票权利。


25.png


当主节点不可用时,将会选择从节点成为主Primary,主节点恢复后,将其作为从节点加入到现有的复制集群中即可。


26.png


3. 节点类型


优先级0型(Priority 0)节点


优先级0型节点不可以成为成为主节点,也不能触发选举。将从节点配置为优先级为0以防止它成为主节点,这在多数据中心部署中特别有用,在许多情况下,您无需将备用数据库设置为优先级0.但是,在具有不同硬件或地理分布的副本集中,优先级为0的备用数据库可确保仅某些成员成为主数据库,这样可以根据实际网络分区的网络质量等实际情况进行配置。


例如,一个数据中心承载主数据中心和辅助数据中心:


27.png


将第二个数据中心节点优先级为0只能为从节点数据库,而数据中心1中的节点才能成为主节点数据库。(比如你跨机房A、B部署了一个复制集,并且想指定Primary必须在A机房,这时可以将B机房的复制集成员Priority设置为0,这样Primary就一定会是A机房的成员),


隐藏型(Hidden)节点


隐藏型(Hidden)节点:


  • 隐藏型从节点是维护主数据集的副本,但对客户端应用程序不可见。隐藏型从节点适用于具有与副本集中其他成员不同的使用模式。
  • 隐藏型从节点必须始终优先为0型从节点,因此不能成为主节点。 隐藏型从节点可能会在选举中投票。
  • 隐藏型从节点将不会收到来自应用程序的请求。我们可以将隐藏型从节点专用于报表节点或是备份节点。


28.png


延迟型(Delayed)节点


由于延迟型从节点是数据集的“滚动备份”或运行“历史”快照,因此它们可以帮助您从各种人为错误中恢复。 例如,延迟节点可以从不成功的应用程序升级和操作员错误(包括丢弃的数据库和集合)中恢复。而且延迟型从节点一定是优先级为0的从节点,也是隐藏型从节点。不能成主节点,也不能给客户端查询。


28.png


在选择延迟量时,请考虑延迟量:


  • 必须等于或大于预期的维护窗口持续时间。
  • 必须小于oplog的容量。


投票型(Vote)节点以及不可投票节点


复制集节点可以通过配置members[n].votes来决定该节点是否具有投票权利!members[n].votes值为1具有投票权利为投票型节点,为0则不可以投票即为不可投票节点。无表决权的节点必须优先级为0,也是优先级大于0的成员不能为0值。虽然无表决权的成员不在选举中投票,但这些成员持有副本集数据的副本,并且可以接受来自客户端应用程序的读取操作。


另外在副本集最多可包含50个成员,但只有7个投票成员,因此非投票成员允许副本集具有7个以上的成员。并投票成员只有具备以下状态可以进行投票:


  • PRIMARY
  • SECONDARY
  • STARTUP2
  • RECOVERING
  • ARBITER
  • ROLLBACK


28.png


配置:


{
   "_id" : <num>,
   "host" : <hostname:port>,
   "arbiterOnly" : false,
   "buildIndexes" : true,
   "hidden" : false,
   "priority" : 0,
   "tags" : {
},
   "slaveDelay" : NumberLong(0),
   "votes" : 0
}
复制代码


4. 部署结构:


最大投票成员为数量


副本集最多可包含50个成员,但只有7个投票成员。 如果副本集已有7个投票成员,则其他成员必须是非投票成员。


部署奇数个成员


副本集应该确保具有奇数个投票成员,如果您拥有偶数个投票成员,请部署仲裁节点,以便该集合具有奇数个投票成员。仲裁节点不存储数据的副本并且需要更少的资源。 因此,您可以在应用程序服务器或其他共享进程上运行仲裁程序。容错能力


副本集的容错是当变为不可用的成员数,并且仍然在副本集中留下足够的节点成员来选择主节点成员。容错是副本集大小的影响, 见下表:


Number of Members Majority Required to Elect a New Primary Fault Tolerance
3 2 1
4 3 1
5 3 2
6 4 2


因此可以得出,将成员添加为偶数个到副本集并不总是会增加容错能力。但是,在这些情况下,其中将其中一个节点设置成隐藏型和延迟型从节点可以为专用功能提供支持,例如备份或报告。


提高读负载能力


在具有非常高读取流量的部署中,您可以通过将读取分发给从节点来提高读取吞吐量。 随着部署的增长,将节点添加或移动到备用数据中心以提高冗余和可用性。


副本集分布在两个或更多数据中心


副本集分布在两个或更多数据中心的优势:


  • 如果其中一个数据中心发生故障,数据仍可用于读取。
  • 如果具有少数成员的数据中心发生故障,则副本集仍可以提供写操作以及读操作。但是,如果具有大多数成员的数据中心发生故障,则副本集将变为只读。


在不同地域部署数据节点(具有备用的数据中心)


要在数据中心发生故障时保护您的数据,请在备用数据中心至少保留一个成员。 如果可能,使用奇数个数据中心,并选择一个成员分布,以最大限度地提高即使丢失数据中心的可能性,剩余的副本集成员可以形成可以形成“大多数”选取出主节点,并有提供数据的副本的能力。为确保主数据中心的节点在备用数据中心的成员之前被选为主要成员,请将备用数据中心中节点members[n].priority 设置为低于主数据中节点,如下所示:


根据部署结构部署复制集示例三个节点成员的副本集,成员合理分布以及解析如下


  • 两个数据中心:数据中心1的两个成员和数据中心2的一个成员。如果副本集的其中一个成员是仲裁者,则将仲裁者分配给具有数据承载成员的数据中心1。
  • 如果数据中心1关闭,则副本集将变为只读。
  • 如果数据中心2关闭,则副本集仍然可写,因为数据中心1中的成员可以进行选举。
  • 三个数据中心:一个成员到数据中心1,一个成员到数据中心2,一个成员到数据中心3。
  • 如果任何数据中心发生故障,副本集仍然可写,因为其余成员可以举行选举。


五副节点成员的副本集,成员合理分布以及解析如下:


  • 两个数据中心:数据中心1的三个成员和数据中心2的两个成员。
  • 如果数据中心1关闭,则副本集将变为只读。
  • 如果数据中心2关闭,则副本集仍然可写,因为数据中心1中的成员可以创建多数。
  • 三个数据中心:数据中心1的两个成员,数据中心2的两个成员和数据中心3的一个成员。
  • 如果任何数据中心发生故障,副本集仍然可写,因为其余成员可以举行选举。


高可用


集群具有自主选举能力,影响选取的因子和条件有以下:


  • 选取协议
  • 心跳机制:复制集成员间默认每2s会发送一次心跳信息,如果10s未收到某个节点的心跳,则认为该节点已宕机不可以访问;如果宕机的节点为Primary,Secondary(前提是可被选为Primary)会发起新的Primary选举。
  • 节点优先权:每个节点都会倾向于投票给优先级最高的节点,优先级为0的节点不能成为主节点Primary,也不会主动发起Primary选举。当Primary发现有优先级更高Secondary,并且该Secondary的数据落后在10s内,则Primary会主动降级,让优先级更高的Secondary有成为Primary的机会。
  • 丢失数据中心:使用分布式副本集,数据中心的丢失可能会影响其他数据中心或数据中心中其余成员选择主数据库的能力。如果可能,在数据中心之间分发副本集成员,以最大限度地提高即使丢失数据中心的可能性,其余一个副本集成员也可以成为新的主要成员。
  • 网络分区:只有跟大多数投票节点间能保持网络畅通,才有机会被选主节点Primary;如果Primary与大多数的节点失去联系,Primary会主动降级为Secondary。当发生网络分区时,可能在短时间内出现多个Primary,故Driver在写入时,最好设置『大多数成功』的策略,这样即使出现多个Primary,也只有一个Primary能成功写入大多数。


5. Write concern和Read Preference


5.1 Write concern


Write concern描述了在操作返回成功之前必须确认写操作的数据承载成员(即主节点成员和从节点成员,但不是仲裁者)的数量。成员只能在收到并成功应用写入后才能确认写入操作。


对于副本集,默认的w:1的Write concern 要求在返回Write concern确认之前,只有Primary主节点确认写入。您可以指定一个大于1的整数值,以要求来自主节点的确认以及满足指定值所需的多个从节点,最多为副本集中数据承载成员的总数。


Client 发出带有需要写入请求的写入操作Write concern将等待直到主节点接收来自指定需要写入询问所有数量的成员的确认。对于大于1或w:“majority ”的写入咨询 Write concern,主节点接收到所需的从节点数量在返回确认可写入答复通知client确认写入。对于w:1的写入咨询Write Concern,主要可以在本地应用(单机模式)写入时立即返回可写入答复,因为它有资格对所请求的Write Concern做出判决。


指定超时等待写入咨询Write concern的写操作仅表示所需数量的副本集成员未在wtimeout时间段内确认写操作。它不一定表示主节点Primary未能应用写入。


检验写操作


在insert()方法中增加write Concern选项,并指定“大多数”写入关注和5秒超时,以便操作不会无限期地阻塞,如下:


db.products.insert(
{ item: "envelopes", qty : 100, type: "Clasp" },
{ writeConcern: { w: "majority" , wtimeout: 5000 } }
)
复制代码


例如,在3个节点成员的副本集中,操作将需要来自3个成员中的2个的确认。如果稍后缩放副本集以包括两个额外的投票节点,则相同的操作将需要来自5个副本集成员中的3个的确认。如果主节点服务器未在wtimeout限制内返回写入咨询 Write concern确认,则写入操作将失败并出现写入问题错误。


修改默认Write Concern


可以通过在副本集配置中设置settings.getLastErrorDefaults设置来修改副本集的默认写入问题。配置在返回之前等待写操作(在大多数投票成员上确认后)操作命令:


cfg = rs.conf()
cfg.settings.getLastErrorDefaults = { w: "majority", wtimeout: 5000 }
rs.reconfig(cfg)
复制代码


5.2 Read Preference


Read Preference是mongodb如何将读操作分配到节点中,默认情况下,应用程序将其读取操作定向到副本集中的主要成员(即读取首选项模式“primary”)。 但是,客户端可以指定读取首选项以将读取操作发送到辅助节点。Read Preference 模式如下:


  • primary: 默认规则,所有读请求发到Primary
  • primaryPreferred: Primary优先,如果Primary不可达,请求Secondary
  • secondary: 所有的读请求都发到secondary
  • secondaryPreferred:Secondary优先,当所有Secondary不可达时,请求Primary
  • nearest:读请求发送到最近的可达节点上(通过ping探测得出最近的节点)


以下是使用读取首选项模式的常见用例:


  • 为地理分布的应用程序提供本地读取。
  • 如果您在多个数据中心中安装了应用程序服务器,则可以考虑使用地理位置分散的副本集并使用非主要或最近的读取首选项。 这允许客户端从最低延迟成员读取,而不是始终从主要成员读取。
  • 在故障转移期间维护可用性。
  • 如果希望应用程序在正常情况下从主数据库读取,则允许使用primaryPreferred,但在主数据库不可用时允许从辅助服务器读取过时的数据。 这为故障转移期间的应用程序提供了“只读模式”。



相关实践学习
MongoDB数据库入门
MongoDB数据库入门实验。
快速掌握 MongoDB 数据库
本课程主要讲解MongoDB数据库的基本知识,包括MongoDB数据库的安装、配置、服务的启动、数据的CRUD操作函数使用、MongoDB索引的使用(唯一索引、地理索引、过期索引、全文索引等)、MapReduce操作实现、用户管理、Java对MongoDB的操作支持(基于2.x驱动与3.x驱动的完全讲解)。 通过学习此课程,读者将具备MongoDB数据库的开发能力,并且能够使用MongoDB进行项目开发。 &nbsp; 相关的阿里云产品:云数据库 MongoDB版 云数据库MongoDB版支持ReplicaSet和Sharding两种部署架构,具备安全审计,时间点备份等多项企业能力。在互联网、物联网、游戏、金融等领域被广泛采用。 云数据库MongoDB版(ApsaraDB for MongoDB)完全兼容MongoDB协议,基于飞天分布式系统和高可靠存储引擎,提供多节点高可用架构、弹性扩容、容灾、备份回滚、性能优化等解决方案。 产品详情: https://www.aliyun.com/product/mongodb
目录
相关文章
|
5月前
|
运维 监控 NoSQL
【MongoDB 复制集秘籍】Secondary 同步慢怎么办?深度解析与实战指南,让你的数据库飞速同步!
【8月更文挑战第24天】本文通过一个具体案例探讨了MongoDB复制集中Secondary成员同步缓慢的问题。现象表现为数据延迟增加,影响业务运行。经分析,可能的原因包括硬件资源不足、网络状况不佳、复制日志错误等。解决策略涵盖优化硬件(如增加内存、升级CPU)、调整网络配置以减少延迟以及优化MongoDB配置(例如调整`oplogSize`、启用压缩)。通过这些方法可有效提升同步效率,保证系统的稳定性和性能。
122 4
|
22天前
|
存储 缓存 安全
只会“有序无序”?面试官嫌弃的List、Set、Map回答!
小米,一位热衷于技术分享的程序员,通过与朋友小林的对话,详细解析了Java面试中常见的List、Set、Map三者之间的区别,不仅涵盖了它们的基本特性,还深入探讨了各自的实现原理及应用场景,帮助面试者更好地准备相关问题。
55 20
|
2月前
|
存储 NoSQL MongoDB
MongoDB面试专题33道解析
大家好,我是 V 哥。今天为大家整理了 MongoDB 面试题,涵盖 NoSQL 数据库基础、MongoDB 的核心概念、集群与分片、备份恢复、性能优化等内容。这些题目和解答不仅适合面试准备,也是日常工作中深入理解 MongoDB 的宝贵资料。希望对大家有所帮助!
|
2月前
|
存储 NoSQL MongoDB
【赵渝强老师】部署MongoDB复制集
本文介绍了如何在单个节点上搭建MongoDB复制集环境,通过监听不同端口实现多节点配置。详细步骤包括创建数据目录、编辑配置文件、启动节点、初始化复制集、查看状态以及测试主从库的读写操作。文中还提供了视频讲解和代码示例,帮助读者更好地理解和操作。
|
2月前
|
存储 NoSQL MongoDB
【赵渝强老师】MongoDB复制集的体系架构
MongoDB的复制集是一种集群技术,由一个Primary节点和多个Secondary节点组成,实现数据的高可用性。Primary节点处理写入请求,Secondary节点同步数据。当Primary节点故障时,Secondary节点可通过选举成为新的Primary节点。视频讲解和示意图详见正文。
|
5月前
|
C# UED 开发者
WPF与性能优化:掌握这些核心技巧,让你的应用从卡顿到丝滑,彻底告别延迟,实现响应速度质的飞跃——从布局到动画全面剖析与实例演示
【8月更文挑战第31天】本文通过对比优化前后的方法,详细探讨了提升WPF应用响应速度的策略。文章首先分析了常见的性能瓶颈,如复杂的XAML布局、耗时的事件处理、不当的数据绑定及繁重的动画效果。接着,通过具体示例展示了如何简化XAML结构、使用后台线程处理事件、调整数据绑定设置以及利用DirectX优化动画,从而有效提升应用性能。通过这些优化措施,WPF应用将更加流畅,用户体验也将得到显著改善。
350 1
|
5月前
|
监控 NoSQL 大数据
【MongoDB复制集瓶颈】高频大数据写入引发的灾难,如何破局?
【8月更文挑战第24天】在MongoDB复制集中,主节点处理所有写请求,从节点通过复制保持数据一致性。但在大量高频数据插入场景中,会出现数据延迟增加、系统资源过度消耗、复制队列积压及从节点性能不足等问题,影响集群性能与稳定性。本文分析这些问题,并提出包括优化写入操作、调整写入关注级别、采用分片技术、提升从节点性能以及持续监控调优在内的解决方案,以确保MongoDB复制集高效稳定运行。
122 2
|
5月前
|
C# 开发者 Windows
全面指南:WPF无障碍设计从入门到精通——让每一个用户都能无障碍地享受你的应用,从自动化属性到焦点导航的最佳实践
【8月更文挑战第31天】为了确保Windows Presentation Foundation (WPF) 应用程序对所有用户都具备无障碍性,开发者需关注无障碍设计原则。这不仅是法律要求,更是社会责任,旨在让技术更人性化,惠及包括视障、听障及行动受限等用户群体。
100 0
|
28天前
|
算法
你对Collection中Set、List、Map理解?
你对Collection中Set、List、Map理解?
60 18
你对Collection中Set、List、Map理解?
|
2月前
|
存储 C++ 容器
【C++】map、set基本用法
本文介绍了C++ STL中的`map`和`set`两种关联容器。`map`用于存储键值对,每个键唯一;而`set`存储唯一元素,不包含值。两者均基于红黑树实现,支持高效的查找、插入和删除操作。文中详细列举了它们的构造方法、迭代器、容量检查、元素修改等常用接口,并简要对比了`map`与`set`的主要差异。此外,还介绍了允许重复元素的`multiset`和`multimap`。
35 3
【C++】map、set基本用法