mongodb 对内存的严重占用以及解决方法【转载】

本文涉及的产品
云数据库 MongoDB,独享型 2核8GB
推荐场景:
构建全方位客户视图
简介:
mongodb 对内存的严重占用以及解决方法【转载】 

刚开始使用mongodb的时候,不太注意mongodb的内存使用,但通过查资料发现mongodb对内存的占用是巨大的,在本地测试服务器中,8G的内存居然被占用了45%。汗呀。 
本文就来剖析一下mongodb对内存的具体使用方法,以及生产环境针对mongodb占大量内存的问题的解决。 
先看一个MongoDB服务器的top命令结果 
shell> top -p $(pidof mongod) 
Mem:  32872124k total, 30065320k used,  2806804k free,   245020k buffers 
Swap:  2097144k total,      100k used,  2097044k free, 26482048k cached 
VIRT  RES  SHR %MEM 
1892g  21g  21g 69.6 

或者 先top后,然后 shift+m 把当前进场按占用内存的多少排序。看看你的mongodb能占用多少内存。 


先了解一下linux对内存的管理方式: 
在Linux里(别的系统也差不多),内存有物理内存和虚拟内存之说,物理内存是什么自然无需解释,虚拟内存实际是物理内存的抽象,多数情况下,出于方便性的考虑,程序访问的都是虚拟内存地址,然后操作系统会把它翻译成物理内存地址。 
很多人会把虚拟内存和Swap混为一谈,实际上Swap只是虚拟内存引申出的一种技术而已:操作系统一旦物理内存不足,为了腾出内存空间存放新内容,就会把当前物理内存中的内容放到交换分区里,稍后用到的时候再取回来,需要注意的是,Swap的使用可能会带来性能问题,偶尔为之无需紧张,糟糕的是物理内存和交换分区频繁的发生数据交换,这被称之为Swap颠簸,一旦发生这种情况,先要明确是什么原因造成的,如果是内存不足就好办了,加内存就可以解决,不过有的时候即使内存充足也可能会出现这种问题,比如MySQL就有可能出现这样的情况,解决方法是限制使用Swap: 
shell> sysctl -w vm.swappiness=0 
查看内存情况最常用的是free命令: 
shell> free -m 
             total       used       free     shared    buffers     cached 
Mem:         32101      29377       2723          0        239      25880 
-/+ buffers/cache:       3258      28842 
Swap:         2047          0       2047 
新手看到used一栏数值偏大,free一栏数值偏小,往往会认为内存要用光了。其实并非如此,之所以这样是因为每当我们操作文件的时候,Linux都会尽可能的把文件缓存到内存里,这样下次访问的时候,就可以直接从内存中取结果,所以cached一栏的数值非常的大,不过不用担心,这部分内存是可回收的,操作系统会按照LRU算法淘汰冷数据。除了cached,还有一个buffers,它和cached类似,也是可回收的,不过它的侧重点在于缓解不同设备的操作速度不一致造成的阻塞,这里就不多做解释了。 
知道了原理,我们就可以推算出系统可用的内存是free + buffers + cached: 
shell> echo "2723 + 239 + 25880" | bc -l 
28842 
至于系统实际使用的内存是used – buffers – cached: 
shell> echo "29377 - 239 - 25880" | bc -l 
3258 
除了free命令,还可以使用sar命令: 
shell> sar -r 
kbmemfree kbmemused  %memused kbbuffers  kbcached 
  3224392  29647732     90.19    246116  26070160 
  3116324  29755800     90.52    245992  26157372 
  2959520  29912604     91.00    245556  26316396 
  2792248  30079876     91.51    245680  26485672 
  2718260  30153864     91.73    245684  26563540 

shell> sar -W 
pswpin/s pswpout/s 
    0.00      0.00 
    0.00      0.00 
    0.00      0.00 
    0.00      0.00 
    0.00      0.00 
希望你没有被%memused吓到,如果不幸言中,请参考free命令的解释。 

接着咱们分析一下mongodb是怎么使用内存的: 

目前,MongoDB使用的是内存映射存储引擎,它会把磁盘IO操作转换成内存操作,如果是读操作,内存中的数据起到缓存的作用,如果是写操作,内存还可以把随机的写操作转换成顺序的写操作,总之可以大幅度提升性能。MongoDB并不干涉内存管理工作,而是把这些工作留给操作系统的虚拟缓存管理器去处理,这样的好处是简化了MongoDB的工作,但坏处是你没有方法很方便的控制MongoDB占多大内存,事实上MongoDB会占用所有能用的内存,所以最好不要把别的服务和MongoDB放一起。 

有时候,即便MongoDB使用的是64位操作系统,也可能会遭遇臭名昭著的OOM问题,出现这种情况,多半是因为限制了虚拟内存的大小所致,可以这样查看当前值: 

shell> ulimit -a | grep 'virtual' 
多数操作系统缺省都是把它设置成unlimited的,如果你的操作系统不是,可以这样修改: 

shell> ulimit -v unlimited 
不过要注意的是,ulimit的使用是有上下文的,最好放在MongoDB的启动脚本里。 

有时候,出于某些原因,你可能想释放掉MongoDB占用的内存,不过前面说了,内存管理工作是由虚拟内存管理器控制的,所以通常你只能通过重启服务来释放内存,你一定不齿于这样的方法,幸好可以使用MongoDB内置的closeAllDatabases命令达到目的: 

mongo> use admin 
mongo> db.runCommand({closeAllDatabases:1}) 
另外,通过调整内核参数drop_caches也可以释放缓存: 

shell> sysctl -w vm.drop_caches=1 
平时可以通过mongo命令行来监控MongoDB的内存使用情况,如下所示: 

mongo> db.serverStatus().mem: 

    "resident" : 22346, 
    "virtual" : 1938524, 
    "mapped" : 962283 

还可以通过mongostat命令来监控MongoDB的内存使用情况,如下所示: 
shell> mongostat 
mapped  vsize    res faults 
  940g  1893g  21.9g      0 
  940g  1893g  21.9g      0 
  940g  1893g  21.9g      0 
  940g  1893g  21.9g      0 
  940g  1893g  21.9g      0 

其中内存相关字段的含义是: 
mapped:映射到内存的数据大小 
visze:占用的虚拟内存大小 
res:实际使用的内存大小 
注:如果操作不能再内存中完成,结果faults列的数值不会是0,视大小可能有性能问题。 

在上面的结果中,vsize是mapped的两倍,而mapped等于数据文件的大小,所以说vsize是数据文件的两倍,之所以会这样,是因为本例中,MongoDB开启了journal,需要在内存里多映射一次数据文件,如果关闭journal,则vsize和mapped大致相当。 

如果想验证这一点,可以在开启或关闭journal后,通过pmap命令来观察文件映射情况: 
shell> pmap $(pidof mongod) 
到底MongoDB配备多大内存合适?宽泛点来说,多多益善,如果要确切点来说,这实际取决于你的数据及索引的大小,内存如果能够装下全部数据加索引是最佳情况,不过很多时候,数据都会比内存大,比如本文说涉及的MongoDB实例: 
mongo> db.stats() 

        "dataSize" : 1004862191980, 
        "indexSize" : 1335929664 

本例中索引只有1G多,内存完全能装下,而数据文件则达到了1T,估计很难找到这么大内存,此时保证内存能装下热数据即可,至于热数据有多少,这就是个比例问题了,取决于具体的应用。如此一来内存大小就明确了:内存 > 索引 + 热数据。 

根据以上的分析我们可以得出几点结论: 
1. mongodb 直接用操作系统的内存管理器来管理内存。而操作系统采用的是LRU算法淘汰冷数据。 
2. mongodb可以用重启服务、调整内核参数以及mongodb内部的语法去清理mongodb对内存的缓存。可能存在的问题是:这几种清理方式都是全部清理,这样的话mongodb的内存缓存就失效了。 
3. mongodb 对内存的使用是可以被监控的,在生产环境中要定时的去监控这些数据。 
4. mongodb 对内存这种占用方式使其尽量的和其他占用内存的业务分开部署,例如memcahe,sphinx,mysql等。 
5. 操作系统中的交换分区swap 如果操作频繁的话,会严重降低系统效率。要解决可以禁用交换分区,以及增加内存以及做分布式。 
6.  生产环境中mongodb所在的主机应该尽量的大内存。 
相关实践学习
MongoDB数据库入门
MongoDB数据库入门实验。
快速掌握 MongoDB 数据库
本课程主要讲解MongoDB数据库的基本知识,包括MongoDB数据库的安装、配置、服务的启动、数据的CRUD操作函数使用、MongoDB索引的使用(唯一索引、地理索引、过期索引、全文索引等)、MapReduce操作实现、用户管理、Java对MongoDB的操作支持(基于2.x驱动与3.x驱动的完全讲解)。 通过学习此课程,读者将具备MongoDB数据库的开发能力,并且能够使用MongoDB进行项目开发。   相关的阿里云产品:云数据库 MongoDB版 云数据库MongoDB版支持ReplicaSet和Sharding两种部署架构,具备安全审计,时间点备份等多项企业能力。在互联网、物联网、游戏、金融等领域被广泛采用。 云数据库MongoDB版(ApsaraDB for MongoDB)完全兼容MongoDB协议,基于飞天分布式系统和高可靠存储引擎,提供多节点高可用架构、弹性扩容、容灾、备份回滚、性能优化等解决方案。 产品详情: https://www.aliyun.com/product/mongodb
相关文章
|
8月前
|
Java 程序员 C++
深入探讨内存泄漏的原因及解决方法
深入探讨内存泄漏的原因及解决方法
|
8月前
|
存储 监控 Java
内存泄漏及其解决方法
内存泄漏及其解决方法
112 0
|
5月前
|
NoSQL MongoDB
MongoDB 内存占用过大
MongoDB 内存占用过大
112 0
|
5月前
|
缓存 Java Python
Pyglet 内存泄漏 & 页面错误 以及(可能)有用的解决方法
【8月更文挑战第6天】使用`Pyglet`可能遭遇内存泄漏与页面错误。内存泄漏常见原因包括未释放资源、循环引用及频繁创建销毁对象。应确保资源适时释放、避免循环引用并复用对象。页面错误通常源于内存访问越界、资源加载失败或硬件兼容性问题。利用内存分析与调试工具可帮助诊断并解决问题。
|
6月前
|
缓存 算法 Java
JVM内存溢出(OutOfMemory)异常排查与解决方法
JVM内存溢出(OutOfMemory)异常排查与解决方法
|
7月前
|
缓存 监控 算法
【Java】Java内存溢出:原因、预防和解决方法
【Java】Java内存溢出:原因、预防和解决方法
855 2
|
8月前
|
缓存 监控 NoSQL
【MongoDB 专栏】MongoDB 的内存管理与优化
【5月更文挑战第11天】MongoDB的内存管理优化对性能至关重要,涉及数据缓存、索引及执行操作的内存使用。动态内存管理根据访问模式和负载调整,可通过配置参数优化,如设置合适缓存大小,调整内存分配参数。索引管理也很重要,需定期评估优化,避免内存占用过高。监控内存使用、数据清理压缩、架构规划也是优化手段。面对挑战,如高并发下的内存不足,需灵活调整策略,平衡系统资源。不断学习新方法,提升内存管理能力,以优化MongoDB性能。
386 2
【MongoDB 专栏】MongoDB 的内存管理与优化
|
6月前
|
存储 监控 算法
Java中的内存泄漏问题及其解决方法
Java中的内存泄漏问题及其解决方法
|
8月前
|
Web App开发 监控 前端开发
深入理解JavaScript内存泄漏:原因与解决方法
深入理解JavaScript内存泄漏:原因与解决方法
|
存储 NoSQL 数据建模
MongoDB性能系列最佳实践-数据建模与内存优化
帮助用户在多个关键方面实现规模化性能优化
MongoDB性能系列最佳实践-数据建模与内存优化