MongoDB性能最佳实践:事务和读/写关注点

本文涉及的产品
云数据库 Tair(兼容Redis),内存型 2GB
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
Redis 开源版,标准版 2GB
推荐场景:
搭建游戏排行榜
简介: MongoDB系列技术文章精选

欢迎阅读有关MongoDB性能最佳实践的系列博文的第五篇。

在这个系列中,我们从多个重要维度上讨论实现大规模性能的关键考虑因素,包括:

  • 数据建模和内存大小,即工作集
  • 查询模式和性能分析
  • 索引
  • 分片
  • 事务和读/写关注点(本期讨论的内容)
  • 硬件和操作系统配置
  • 基准测试

单文档的原子性

MongoDB的文档模型可以将相关数据汇集到一起,简化了传统关系型数据库中需要通过父子表关系建模的复杂性。其单文档操作具备原子性,能够满足大多数应用程序对数据完整性的要求。
在MongoDB中,单个操作可以同时更新多个字段,包括对多个子文档和数组元素的修改。MongoDB首先会确保文档在更新过程中的完全隔离;同时,任何操作错误都会触发回滚机制,保证客户端获取的文档总是一致的。

多文档ACID事务的引入

MongoDB中的事务为开发者提供了一种熟悉的体验,如同关系型数据库中的事务一样,具有多语句支持和相似的语法结构,便于集成到任何应用程序中。事务通过提供快照隔离来确保数据的一致性,并且遵循“全有或全无”的原则,同时对那些不依赖于事务特性的工作负载的性能没有负面影响。

您可以通过查阅我们在VLDB会议上发布的论文中的TPC-C基准测试结果来了解事务的性能表现。

此外,我们提供了一些策略,帮助您在应用程序中最大限度地利用MongoDB事务的优势。

多文档事务的最佳实践

创建长时间运行的事务,或在单个ACID事务中执行过多操作,都可能对WiredTiger存储引擎的缓存造成显著压力。这是因为缓存需要从最早的快照创建开始,就为后续所有的写入操作保持状态。由于事务在运行过程中始终使用同一快照,因此缓存中会不断积累新的写入,直到长时间运行的事务提交或中止,释放其所持锁定时,这些写入才能从缓存中被清除。

为了保持数据库性能的可预测性,开发人员应考虑以下建议。
(1)事务运行时限制
默认情况下,MongoDB会自动终止运行时间超过60秒的多文档事务。不过,如果服务器的写入负载相对较低,您可以调整事务设置,延长其执行时间。
为了防止事务超时,建议将大型事务拆分成多个较小的操作,确保它们能够在设定的时间限制内完成。同时,应当优化查询模式,并确保拥有合适的索引,这样可以在事务过程中快速访问数据。

(2)事务中的操作数量
虽然在事务中读取的文档数量并没有严格的限制,但从最佳实践来看,建议在一个事务中修改的文档数量不要超过1,000个。

对于需要修改超过1,000个文档的操作,开发人员应考虑将这些操作分解为多个部分,每个部分处理一批文档,以此来组织事务。

(3)分布式、多分片事务
跨多个分片执行的事务会带来较高的性能开销,因为这需要在多个节点间通过网络进行协调。
在多分片环境中,只有使用快照读关注点(snapshot read concern)才能保证提供一致的数据快照。然而,如果对延迟的敏感度超过了对跨分片读取一致性的需求,可以选择默认的本地读关注点,该选项在每个分片的本地快照上进行操作。

(4)异常处理
当事务被中止时,相关的异常会被返回给客户端驱动程序,并且事务的更改会被完全撤销。开发人员需要在应用程序中实现逻辑来捕获这些异常,并对因暂时性问题(例如多版本并发控制(MVCC)的写入冲突、短暂的网络错误或主节点选举)而中止的事务进行重试。

当启用可重试写入功能时,MongoDB的驱动程序会自动重试提交事务的操作。

(5)写入延迟的优势
尽管刚开始可能不那么直观,但使用多文档事务实际上可以通过减少提交所需的延迟来提升写入性能。

当采用“w:majority”这一写关注点时,如果执行10次独立的更新操作,每次更新都必须等待复制到多数节点的时间。而如果把这10个更新操作放入一个事务中执行,这些操作会在事务提交时一次性复制。这种做法可以将延迟降低到原来的十分之一。

更多参考
您可以在MongoDB的多文档事务文档中查看所有最佳实践。有关性能特定的指导,请参考该文档的“生产考虑”部分。

选择适当的写保证

MongoDB允许您在执行写操作时选择所需的持久性级别,这被称为写关注点(write concern)。

值得注意的是,写关注点适用于数据库中的所有操作,无论是对单个文档的简单操作还是多文档事务的一部分。

您可以根据需要在每个连接、数据库、集合,甚至是单个操作的基础上配置以下选项:
已确认写入:这是默认设置。mongod确认执行了写操作,这样客户端就能捕捉到网络问题、键冲突、模式验证错误等异常。

已写入日志:mongod仅在操作被记录到主节点的操作日志后才确认写操作。这确保了即使mongod崩溃,写操作也能得到保留,保证了写入的持久性。

已复制:您还可以选择等待操作被副本集中的其他成员确认。MongoDB支持将写入确认到指定数量的副本。这也确保了写操作被记录在包括主节点在内的辅助节点的日志中。

大多数:这种写关注点等待写操作被大多数副本集成员应用,并且在主节点选举事件中不会被回滚。这也确保了写操作被记录在这些成员的日志中,包括主节点。

以上是MongoDB中关于写关注点的选项,它们帮助您根据应用需求调整数据的持久性和复制保证。

选择适当的读关注点

与写关注点类似,读关注点也适用于数据库中的任何查询操作,无论是对单个文档或一组文档的常规读取,还是作为多文档事务的一部分。

为了保证数据的隔离性和一致性,可以将读关注点设置为majority。这意味着只有当数据已经被复制到副本集大多数成员之后,这些数据才会返回给应用程序,从而保证在主节点选举过程中数据不会发生回滚。

MongoDB还提供了“可线性化”(linearizable)的读关注点级别。启用可线性化读关注点可以确保在读取数据时,该节点仍是副本集的主节点,并且在发生主节点切换后,所返回的数据不会被回滚。但是,配置此级别的读关注点可能会显著增加延迟,因此建议设置maxTimeMS值来为长时间运行的操作设定超时限制。

在需要时使用因果一致性

因果一致性确保在客户端会话中,无论请求被哪个副本节点服务,每次读操作都能看到前一次写操作的结果。您可以根据需要启用因果一致性,仅在需要保证读操作的顺序性时使用它,从而减少潜在的延迟影响。

设置阿里云MongoDB 的默认写关注

阿里云MongoDB 已最新支持 7.0 版本,您可以在阿里云MongoDB 实例详情页的「参数设置」部分,根据需要,对于阿里云MongoDB 的默认写关注进行设置。

更多内容可参考:
https://help.aliyun.com/zh/mongodb/product-overview/mongodb-versions-and-storage-engines

更多内容
以上是本期性能最佳实践系列的内容。在本系列的下一篇文章中,我们将讨论硬件和操作系统配置。访问阿里云官网了解更多 https://www.aliyun.com/product/mongodb?utm_content=g_1000376457

相关实践学习
MongoDB数据库入门
MongoDB数据库入门实验。
快速掌握 MongoDB 数据库
本课程主要讲解MongoDB数据库的基本知识,包括MongoDB数据库的安装、配置、服务的启动、数据的CRUD操作函数使用、MongoDB索引的使用(唯一索引、地理索引、过期索引、全文索引等)、MapReduce操作实现、用户管理、Java对MongoDB的操作支持(基于2.x驱动与3.x驱动的完全讲解)。 通过学习此课程,读者将具备MongoDB数据库的开发能力,并且能够使用MongoDB进行项目开发。   相关的阿里云产品:云数据库 MongoDB版 云数据库MongoDB版支持ReplicaSet和Sharding两种部署架构,具备安全审计,时间点备份等多项企业能力。在互联网、物联网、游戏、金融等领域被广泛采用。 云数据库MongoDB版(ApsaraDB for MongoDB)完全兼容MongoDB协议,基于飞天分布式系统和高可靠存储引擎,提供多节点高可用架构、弹性扩容、容灾、备份回滚、性能优化等解决方案。 产品详情: https://www.aliyun.com/product/mongodb
相关文章
|
2月前
|
存储 关系型数据库 MySQL
四种数据库对比MySQL、PostgreSQL、ClickHouse、MongoDB——特点、性能、扩展性、安全性、适用场景
四种数据库对比 MySQL、PostgreSQL、ClickHouse、MongoDB——特点、性能、扩展性、安全性、适用场景
|
4月前
|
JSON NoSQL MongoDB
MongoDB Schema设计实战指南:优化数据结构,提升查询性能与数据一致性
【8月更文挑战第24天】MongoDB是一款领先的NoSQL数据库,其灵活的文档模型突破了传统关系型数据库的限制。它允许自定义数据结构,适应多样化的数据需求。设计MongoDB的Schema时需考虑数据访问模式、一致性需求及性能因素。设计原则强调简洁性、查询优化与合理使用索引。例如,在构建博客系统时,可以通过精心设计文章和用户的集合结构来提高查询效率并确保数据一致性。正确设计能够充分发挥MongoDB的优势,实现高效的数据管理。
86 3
|
4月前
|
存储 NoSQL JavaScript
MongoDB存储过程实战:聚合框架、脚本、最佳实践,一文全掌握!
【8月更文挑战第24天】MongoDB是一款备受欢迎的文档型NoSQL数据库,以灵活的数据模型和强大功能著称。尽管其存储过程支持不如传统关系型数据库,本文深入探讨了MongoDB在此方面的最佳实践。包括利用聚合框架处理复杂业务逻辑、封装业务逻辑提高复用性、运用JavaScript脚本实现类似存储过程的功能以及考虑集成其他工具提升数据处理能力。通过示例代码展示如何创建订单处理集合并定义验证规则,虽未直接实现存储过程,但有效地演示了如何借助JavaScript脚本处理业务逻辑,为开发者提供更多实用指导。
80 2
|
4月前
|
安全 C# 数据安全/隐私保护
WPF安全加固全攻略:从数据绑定到网络通信,多维度防范让你的应用固若金汤,抵御各类攻击
【8月更文挑战第31天】安全性是WPF应用程序开发中不可或缺的一部分。本文从技术角度探讨了WPF应用面临的多种安全威胁及防护措施。通过严格验证绑定数据、限制资源加载来源、实施基于角色的权限管理和使用加密技术保障网络通信安全,可有效提升应用安全性,增强用户信任。例如,使用HTML编码防止XSS攻击、检查资源签名确保其可信度、定义安全策略限制文件访问权限,以及采用HTTPS和加密算法保护数据传输。这些措施有助于全面保障WPF应用的安全性。
62 0
|
6月前
|
NoSQL 测试技术 MongoDB
使用同步和异步方式更新插入MongoDB数据的性能对比
在这篇文章中,我将探讨如何使用同步和异步方式插入数据到MongoDB,并对两种方式的性能进行对比。并将通过Python中的 pymongo 和 motor 库分别实现同步和异步的数据插入,并进行测试和分析。
|
5月前
|
存储 NoSQL Java
使用MongoDB实现NoSQL数据库的最佳实践
使用MongoDB实现NoSQL数据库的最佳实践
|
6月前
|
NoSQL BI MongoDB
深入理解 MongoDB 条件操作符:优化查询、精准筛选、提升性能
深入理解 MongoDB 条件操作符:优化查询、精准筛选、提升性能
147 1
|
6月前
|
NoSQL 安全 MongoDB
精准数据清理:掌握 MongoDB 删除集合的方法与最佳实践
精准数据清理:掌握 MongoDB 删除集合的方法与最佳实践
221 0
|
6月前
|
存储 监控 NoSQL
MongoDB 覆盖索引查询:提升性能的完整指南
MongoDB 覆盖索引查询:提升性能的完整指南
|
5天前
|
存储 NoSQL 关系型数据库
阿里云数据库MongoDB版助力信也科技 打造互联网金融企业样板
我们的风控系统引入阿里云数据库MongoDB版后,解决了特征类字段灵活加减的问题,大大提高了开发效率,极大的提升了业务用户体验,获得了非常好的效果
阿里云数据库MongoDB版助力信也科技 打造互联网金融企业样板