深入浅出理解MongoDB的设计与实现

本文涉及的产品
云数据库 MongoDB,独享型 2核8GB
推荐场景:
构建全方位客户视图
简介: MongoDB是一个基于分布式文件存储的数据库。由C++语言编写。旨在为WEB应用提供可扩展的高性能数据存储解决方案。MongoDB是一个介于关系数据库和非关系数据库之间的产品,是非关系数据库当中功能最丰富,最像关系数据库的。接下来就大家一起分享精彩文章。

本文来自中生代技术群talk show“深入浅出理解MongoDB的设计与实现”总结稿。MongoDB是NoSQL的一种,它是面向文档存储。但是为什么使用MongoDB呢?


MongoDB为代表的NoSQL与传统的关系型数据库存储有何不同呢?本文精彩不容错过。




MongoDB是NoSQL的一种,它是面向文档存储。为什么使用MongoDB?这要先从大数据说起,其中一个经典问题就是从互联网上抓数据。从互联网上我们能抓取大量的数据,那么就面临着存储,更新,查找,错误处理等问题。概括而言就是:

 
1. how to save, update and find?
2. how to deal with failure?
3. how to deal with large data?

 

1. how to save, update and find

1) save

首先是如何保存从互联网上抓取的大量数据。这涉及到数据的存储格式:JSON。它是一种轻量级的数据交换格式,建构于“名称/值”对的集合,简单易读,数据体积小,速度快。
 
MongoDB的数据存储在document中,它是类似JSON的数据结构,由“名称/值”对组成。也就是说,数据块用JSON形式保存下来叫document。而很多document合在一起叫做collection,它类似于MySQL里的table。用JSON的名称/值对,到document,再到collection,大量的数据就保存了下来。
 

2) update

从互联网上抓取的数据,会包含很多属性,比如url, time, author, title, content。而当我们把数据保存完后,如何添加新的属性?比如我们抓取了url, content,然后存储,后来发现还要抓取title并保存。如果之前一块块的数据连续存储完了,这时候就会发现没有空间来添加这个新的属性。一个直接的想法是把要update的原有数据块从原来位置删除,加上新的属性后再添加到后面。

但是这种做法在mongoDB中也有问题:在添加数据的过程中,因为数据从原来的位置上移走,留有了空位,就会产生碎片。为了解决这个问题,可以预留空间。在存完一个数据块之后,留一块空间(padding),这样再加新的属性的时候,直接加在padding里,不用把这个数据块移动。Padding的大小是一个tradeoff,如果太少,起不到效果,而如果太大则浪费空间。
 
那么如何设计padding的大小呢?一种做法是预留document的10%空间,这样document越大padding越大。此外,数据块移动一次,这个百分比就上涨一次,比如从10%变为15%,再移动一次,则变为20%。这种方法类似于TCP/IP中的连接重试算法。
(详见链接:https://technet.microsoft.com/zh-cn/library/ms365783(v=sql.105).aspx)
 
在mongoDB中,documenet在disk上存的大小一般在32k以内。那么在设计padding的时候,选择凑成比它大的最小2的指数,比如documnet本身28k,那么要申请一个32k的空间(padding为4k)。这样数据块一直是2的指数。这样做的好处是,如果此数据块被移走了,留下一个完整的2的指数的空间(比如32k),那么新的数据块(比如10k的数据)可以直接填进去。disk被切成规则的长度,极大地减少碎片。而且,2的指数作为寻址空间时,移动指针可用位操作,更快速。MMAPv1(mongoDB使用的一种存储引擎)中空间分配使用的就是此策略。
 
上面讨论的是添加新的属性,除此之外还有一种就是更新数据本身,比如把id从123改成1234。如果在JSON中,我们还要移动数据,因为原来是3个字符现在变成了4个 。有个方法就是把id存为int类型, 这样123和1234都是32 bits范围内的,可以直接改数据。这种存数据的形式为BSON。BSON用在mongoDB中,是基于JSON格式的数据存储格式。BSON好处之一就是加入了数据类型。
 

3) find

除了保存,更新,还有一个重要操作是find。首先讨论一下基本的find:scan。Scan是我们熟知的遍历,也就是一个个扫数据。比如要寻找某个url,我们一个个数据块,一个个数据查找。但是如果直接遍历,效率低,因为我们扫了很多无用的信息,比如content。为了跳过不需要扫描的东西,我们可以存储数据的长度length,那么我们通过length就能算出下一个url的位置,这样就能只扫描url,略过content等无用的信息。这就是BSON的第二个好处,也是对JSON的一大改进:它将JSON的每一个元素的长度存在元素的头部,这样只需读取到元素长度就能直接找到指定的点上进行读取。
 
如何让查找更快呢?MongoDB提供多种索引类型,比如B tree。B tree类似于二叉树,不过可以有多个分支,而不是只有两个。这样能够减少树的深度,也减少了磁盘I/O读写。
 
对于数据,我们有了比较好的方法,但是还要考虑disk gap。我们希望数据在disk上存的比较连续。为此,可以在disk里申请固定空间。那么申请多少呢?这里可以使用Double算法。具体就是先申请一个较小空间,如果不够用,那么申请一个双倍的空间,依次继续。比如说先申请64MB的空间,不够的话,再申请128MB的空间,再不够,再申请256MB的空间,直到2G停止。
 

2. how to deal with failure

云计算,”error is normal”,因为基数大。大量的数据下,即使每块数据失败的几率很小,总的来看,失败还是平常事。而MongoDB可能会面临的失败包括diskful,power off,disk failure等。这里我们主要讨论disk failure。
 
在讨论failure前,先回到数据的存储。我们除了有disk,还有memory。Memory的读取比disk要快。
 

1) How to deal with the disk failure?

比如一个数据A=3同时存在disk和memory里,我们想把A改为5。我们需要同时修改disk和memory里的数据。但是这样很慢,因为我们涉及到对disk的读写。
 
解决方法:把memory里A改写成5就认为可以了。
新问题:如果此时机器崩溃,A写成的5就没有了。
解决方法:写log/journal来处理,把log存到disk里。
 
虽然log也要写到disk里,但是把log写入disk要比把数据存入disk随机的位置快,这是因为log是sequence写的,而如果是在disk里写数据,指针要不断移动到新的位置,时间要多很多。还有一个tricky的方法:使用两块disk,一个写数据,一个写log。
 
这时候我们遇到另一个问题:如何写log?log有两种:behavior log和binary log。举例说,比如要把A=3改成A=5。behavior log写法就是记录所有信息:time, update, A, 3, 5。而binary log写法相对简单,记录位置和更新后的数据。而在MongoDB里使用第一种写法,具体原因,接下来会解释。
 
前面我们提过,机器随时可能崩溃,为了保证数据的读取,我们需要备份。这样如果一个机器坏了,还可以使用备份。但是新的问题产生了,如何解决数据的同步?
 

2) how to sync the primary and the secondary?

想要同步primary(简称P)机器里的数据和secondary(简称S)机器里的数据,P需要把log传给S,S依据log来更改数据。这也是MongoDB用behavior log的原因,因为在binary log中,address是local的,那么P中的log的地址是P里的,即使是传给S,S还是无法找到数据。
 

3. how to deal large data

1) how to save 100 TB of documents?

当今主流的计算机硬件比较便宜而且可以扩展,因此对于海量的数据,可以把数据(比如100 TB) 存在不同的机器上,形成一个cluster。
 
在MongoDB中,使用sharding(分片)机制来在不同机器上存储资料。每个shard(碎片)都是一个独立的资料库,很多个shards可以组成一个资料库。比如一个1 TB的collection可以分 成4个shard,每个shard存256 GB。如果分成40个shard,那么每个shard只需管理25 GB的资料。
 

2) how to save document of 100TB?

如果一个document就有100 TB,那么要如何存储呢?我们可以把100 TB分成小的数据块。拆成255k每块。为什么不用256k呢?这是因为我们要存metadata,如果用256k,那么就没有空间存metadata。
 

从前面的这些介绍可以看出,每种数据结构或者技术都有它产生的原因。就像MongoDB的产生,就是因为现今的数据量越来越大,传统的SQL在处理海量数据时有它的局限性。为了应对各种新的问题,MongoDB才逐渐发展壮大。



                                                          中生代技术群微信公众号

                                                da9312524921e637b684eed7bf3249db58f7badc

本文来自 Shaoke Xu


相关实践学习
MongoDB数据库入门
MongoDB数据库入门实验。
快速掌握 MongoDB 数据库
本课程主要讲解MongoDB数据库的基本知识,包括MongoDB数据库的安装、配置、服务的启动、数据的CRUD操作函数使用、MongoDB索引的使用(唯一索引、地理索引、过期索引、全文索引等)、MapReduce操作实现、用户管理、Java对MongoDB的操作支持(基于2.x驱动与3.x驱动的完全讲解)。 通过学习此课程,读者将具备MongoDB数据库的开发能力,并且能够使用MongoDB进行项目开发。   相关的阿里云产品:云数据库 MongoDB版 云数据库MongoDB版支持ReplicaSet和Sharding两种部署架构,具备安全审计,时间点备份等多项企业能力。在互联网、物联网、游戏、金融等领域被广泛采用。 云数据库MongoDB版(ApsaraDB for MongoDB)完全兼容MongoDB协议,基于飞天分布式系统和高可靠存储引擎,提供多节点高可用架构、弹性扩容、容灾、备份回滚、性能优化等解决方案。 产品详情: https://www.aliyun.com/product/mongodb
目录
相关文章
|
NoSQL 安全 Java
SpringBoot系列(2)整合MongoDB实现增删改查(完整案例)
自己本科时候一直使用的是Mysql,目前的课题组使用的是MongoDB,因此就花了一部分时间整理了一下,实现springboot与MongoDB的整合,并且实现基本的增删改查操作,从头到尾给出一个完整的案例。
1055 0
SpringBoot系列(2)整合MongoDB实现增删改查(完整案例)
|
存储 NoSQL Java
mongodb基于地理位置查询实现围栏
mongodb基于地理位置查询实现围栏
1556 0
|
NoSQL 前端开发 Java
基于 Mongodb 实现商品管理系统之准备工作讲解|学习笔记
快速学习基于 Mongodb 实现商品管理系统之准备工作讲解
基于 Mongodb 实现商品管理系统之准备工作讲解|学习笔记
|
NoSQL 数据库连接 MongoDB
基于 Mongodb 实现商品管理系统之向数据库中添加商品编写讲解|学习笔记
快速学习基于 Mongodb 实现商品管理系统之向数据库中添加商品编写讲解
基于 Mongodb 实现商品管理系统之向数据库中添加商品编写讲解|学习笔记
|
NoSQL 数据库连接 MongoDB
基于Mongodb实现商品管理系统之根据商品编号删除商品编写讲解|学习笔记
快速学习基于Mongodb实现商品管理系统之根据商品编号删除商品编写讲解
基于Mongodb实现商品管理系统之根据商品编号删除商品编写讲解|学习笔记
|
NoSQL MongoDB Android开发
基于 Mongodb 实现商品管理系统之 Web 层编写讲解|学习笔记
快速学习基于 Mongodb 实现商品管理系统之 Web 层编写讲解
基于 Mongodb 实现商品管理系统之 Web 层编写讲解|学习笔记
|
存储 缓存 NoSQL
分布式服务器框架之Servers.Core中 实现Log模块设计 写入MongoDB数据库
游戏服务器中都需要用到Log模块,log模块存在的意义第一个是将log输出到控制台又或者是写入到log文件中,出了BUG方便定位;第二是常用于将用户的数据(例如玩家登录、道具购买量)将这种log统计到数据库中,方便统计用户留存信息、数据分析等。
|
NoSQL MongoDB 数据库
分布式服务器框架之Server.Core库中实现YFUniqueEntity、YFUniqueIDBase 管理MongoDB 自定义Id的自增
YFUniqueEntity是数据库中的结构,GetUniqueID函数中会根据Type和自增步长去数据库中寻找该类型的当前ID是多少,然后会用当前的Id去加上步长,把更新后的新ID插入到MongoDB中记录着ID的那张表里。
|
NoSQL MongoDB
分布式服务器框架之Servers.Core库中实现 MongoEntityBase 实现阻塞 异步对MongoDB的增删改查
YFMongoDBModelBase类是个模板类,对模板参数进行了约束YFMongoEntityBase,必须要继承YFMongoEntityBase
|
JSON NoSQL MongoDB
分布式服务器框架之Servers.Core库中实现MongoDB的ObjectId和Json转换
分布式服务器框架之Servers.Core库中实现MongoDB的ObjectId和Json转换