Oracle swap 100%案例分析

简介:

操作系统版本:centos5.8 64bit

数据库版本:11.2.0.1 

问题描述:

最近对数据库添加内存到32G,并调大了MEMORY_MAX_SIZE参数为28G,MEMORY_TARGET参数为24G;运行了一小段时间,没有发现大的问题,只是nagios监控到主库和备库的swap使用率偏高,而在添加内存之前并未出现过这种情况,调整前操作系统内存大小为16G,调整后MEMORY_MAX_SIZE和MEMORY_TARGET参数均为11G!

调整前交换分区使用率: 


 
 
  1. 1:主库的交换分区使用率平均值为7.11% 
  2. [root@db1 ~]# sar -f /var/log/sa/sa11 -r 
  3. 11:41:01 PM kbmemfree kbmemused  %memused kbbuffers  kbcached kbswpfree kbswpused  %swpused  kbswpcad 
  4. 11:42:01 PM     93760  16332056     99.43    124792  13621548   7610880    582260      7.11       280 
  5. 11:43:01 PM     87104  16338712     99.47    125084  13622556   7610880    582260      7.11       280 
  6. 11:44:01 PM     79484  16346332     99.52    125384  13624140   7610880    582260      7.11       280 
  7. 11:45:01 PM     77632  16348184     99.53    125684  13625580   7610880    582260      7.11       280 
  8. 11:46:01 PM     62852  16362964     99.62    125936  13634280   7610880    582260      7.11       280 
  9. 11:47:01 PM     58452  16367364     99.64    126484  13635080   7610880    582260      7.11       280 
  10. 11:48:01 PM     61328  16364488     99.63    126856  13639772   7610880    582260      7.11       280 
  11. 11:49:01 PM     64116  16361700     99.61    127040  13630580   7610880    582260      7.11       280 
  12. 11:50:01 PM     65820  16359996     99.60    127268  13625496   7610880    582260      7.11       280 
  13. 11:51:01 PM     59888  16365928     99.64    127148  13588072   7610880    582260      7.11       280 
  14. 11:52:01 PM     84152  16341664     99.49    127412  13589552   7610880    582260      7.11       280 
  15. 11:53:01 PM    102492  16323324     99.38    127716  13590332   7610880    582260      7.11       280 
  16. 11:54:01 PM     96444  16329372     99.41    128076  13602516   7610880    582260      7.11       280 
  17. 11:55:01 PM     88752  16337064     99.46    128408  13607108   7610880    582260      7.11       280 
  18. 11:56:01 PM     78936  16346880     99.52    128708  13608816   7610880    582260      7.11       280 
  19. 11:57:01 PM     57192  16368624     99.65    128936  13609668   7610880    582260      7.11       280 
  20. 11:58:01 PM     64308  16361508     99.61    129192  13611012   7610880    582260      7.11       280 
  21. 11:59:01 PM     62620  16363196     99.62    129476  13612704   7610880    582260      7.11       280 
  22. Average:        94185  16331631     99.43    125388  13559392   7610581    582559      7.11       289 
  23.  
  24. 2:备库的交换分区使用率平均值为12.27% 
  25. 11:41:01 PM kbmemfree kbmemused  %memused kbbuffers  kbcached kbswpfree kbswpused  %swpused  kbswpcad 
  26. 11:42:01 PM     97084  16328732     99.41    283368  14770184   7187548   1005592     12.27     23924 
  27. 11:43:01 PM     95968  16329848     99.42    283396  14770264   7187548   1005592     12.27     23924 
  28. 11:44:01 PM     96760  16329056     99.41    283440  14770392   7187548   1005592     12.27     23924 
  29. 11:45:01 PM     94872  16330944     99.42    283480  14770532   7187548   1005592     12.27     23924 
  30. 11:46:01 PM     95392  16330424     99.42    283520  14770680   7187548   1005592     12.27     23924 
  31. 11:47:01 PM     90196  16335620     99.45    283568  14776592   7187548   1005592     12.27     23924 
  32. 11:48:01 PM     91524  16334292     99.44    283596  14778728   7187548   1005592     12.27     23924 
  33. 11:49:01 PM     91256  16334560     99.44    283648  14778792   7187552   1005588     12.27     23920 
  34. 11:50:01 PM     92560  16333256     99.44    283712  14778824   7187552   1005588     12.27     23920 
  35. 11:51:01 PM     90748  16335068     99.45    283772  14778912   7187552   1005588     12.27     23920 
  36. 11:52:01 PM     91484  16334332     99.44    283800  14779068   7187552   1005588     12.27     23920 
  37. 11:53:01 PM     89964  16335852     99.45    283844  14779136   7187572   1005568     12.27     23944 
  38. 11:54:01 PM     80092  16345724     99.51    283980  14790212   7187572   1005568     12.27     23944 
  39. 11:55:01 PM     72728  16353088     99.56    284052  14792660   7187572   1005568     12.27     23944 
  40. 11:56:01 PM     72300  16353516     99.56    284092  14792844   7187612   1005528     12.27     23936 
  41. 11:57:01 PM     72264  16353552     99.56    284152  14792908   7187612   1005528     12.27     23936 
  42. 11:58:01 PM     73680  16352136     99.55    284248  14793040   7187612   1005528     12.27     23936 
  43. 11:59:01 PM     73836  16351980     99.55    284300  14793172   7187612   1005528     12.27     23936 
  44. Average:        71240  16354576     99.57    265982  14818731   7172819   1020321     12.45     23450 

调整后交换分区使用率: 


 
 
  1. 1:主库的交换分区使用率平均值为34.18% 
  2. [root@db1 ~]# sar -f /var/log/sa/sa13 -r  
  3. 11:41:01 PM kbmemfree kbmemused  %memused kbbuffers  kbcached kbswpfree kbswpused  %swpused  kbswpcad 
  4. 11:42:01 PM    189612  32759404     99.42    423500  29933996   5353540   2839600     34.66    633656 
  5. 11:43:01 PM    166404  32782612     99.49    423528  29934144   5353540   2839600     34.66    633656 
  6. 11:44:01 PM    167176  32781840     99.49    423560  29934448   5353544   2839596     34.66    633652 
  7. 11:45:01 PM    105964  32843052     99.68    423100  30125676   5353548   2839592     34.66    513156 
  8. 11:46:01 PM     91348  32857668     99.72    423116  30108604   5353548   2839592     34.66    497332 
  9. 11:47:01 PM    101608  32847408     99.69    423136  30104324   5353552   2839588     34.66    492240 
  10. 11:48:01 PM    119196  32829820     99.64    423180  30104556   5353552   2839588     34.66    492240 
  11. 11:49:01 PM    131556  32817460     99.60    423220  30104752   5353556   2839584     34.66    492236 
  12. 11:50:01 PM    128396  32820620     99.61    423256  30105528   5353560   2839580     34.66    492232 
  13. 11:51:01 PM    134268  32814748     99.59    423292  30107804   5353568   2839572     34.66    492224 
  14. 11:52:01 PM    137028  32811988     99.58    423316  30107968   5353572   2839568     34.66    492220 
  15. 11:53:01 PM    131340  32817676     99.60    423348  30108064   5353572   2839568     34.66    492220 
  16. 11:54:01 PM    135292  32813724     99.59    423452  30119040   5353572   2839568     34.66    492220 
  17. 11:55:01 PM    125736  32823280     99.62    423488  30119164   5353576   2839564     34.66    492216 
  18. 11:56:01 PM    120496  32828520     99.63    423528  30119412   5353580   2839560     34.66    492212 
  19. 11:57:01 PM    125356  32823660     99.62    423568  30119588   5353580   2839560     34.66    492212 
  20. 11:58:01 PM    102808  32846208     99.69    423584  30119912   5353580   2839560     34.66    492212 
  21. 11:59:01 PM    104964  32844052     99.68    423636  30115728   5353584   2839556     34.66    487984 
  22. Average:       170975  32778041     99.48    377625  29129299   5392719   2800421     34.18   1536258 
  23.  
  24. 2:备库的交换分区使用率甚至出现100%的情况 
  25. 12:58:01 AM kbmemfree kbmemused  %memused kbbuffers  kbcached kbswpfree kbswpused  %swpused  kbswpcad 
  26. 12:59:01 AM    133468  32815548     99.59    382232  30133608   6997136   1196004     14.60   1196004 
  27. 01:00:01 AM    133564  32815452     99.59    382244  30133784   6997136   1196004     14.60   1196004 
  28. 01:01:01 AM     92316  32856700     99.72    358832  24656912   1520804   6672336     81.44   6672332 
  29. 01:02:01 AM     96292  32852724     99.71    313508  25143044         8   8193132    100.00   6223732 
  30. 01:03:01 AM    100724  32848292     99.69    229156  28053604         0   8193140    100.00   3377964 
  31. 01:04:01 AM     94672  32854344     99.71    141536  30348384        84   8193056    100.00   1189700 
  32. 01:05:01 AM     99560  32849456     99.70    118908  31574272         0   8193140    100.00      2012 
  33. 01:06:01 AM     91352  32857664     99.72     96656  31646268         0   8193140    100.00      1644 
  34. 01:07:01 AM     96028  32852988     99.71     90408  31694700         0   8193140    100.00       552 
  35. 01:08:01 AM     93512  32855504     99.72     74632  31747136         0   8193140    100.00       420 
  36. 01:09:01 AM     93272  32855744     99.72     72944  31787152         0   8193140    100.00       452 
  37. 01:10:01 AM     92996  32856020     99.72     71336  31840408         0   8193140    100.00       424 
  38. 01:11:01 AM     96912  32852104     99.71     70420  31867152         0   8193140    100.00       356 
  39. 01:12:01 AM     92136  32856880     99.72     72880  31890820         0   8193140    100.00       352 
  40. 01:13:01 AM     94672  32854344     99.71     66760  31917328         0   8193140    100.00       268 
  41. 01:14:01 AM     96804  32852212     99.71     64648  31940808         0   8193140    100.00       208 
  42. 01:15:01 AM     92628  32856388     99.72     56732  31954208         0   8193140    100.00       124 
  43. 01:16:01 AM     93524  32855492     99.72     55568  31962064         0   8193140    100.00       244 
  44. 01:17:01 AM     96796  32852220     99.71     56176  31957600         0   8193140    100.00       168 
  45. 01:18:02 AM     95520  32853496     99.71     51832  31968804         0   8193140    100.00       204 
  46. 01:19:01 AM     91320  32857696     99.72     51224  31936896         0   8193140    100.00       148 
  47. 01:20:01 AM     93032  32855984     99.72     51716  31962408         0   8193140    100.00       184 
  48. 01:21:01 AM     97792  32851224     99.70     51564  31970344         0   8193140    100.00       216 
  49. 01:22:01 AM     93368  32855648     99.72     50852  31952144         0   8193140    100.00       220 
  50. 01:23:01 AM     90496  32858520     99.73     51452  31888096         0   8193140    100.00       196 
  51. 01:24:01 AM    139524  32809492     99.58     52468  31860700        44   8193096    100.00       844 
  52. 01:25:01 AM     97008  32852008     99.71     52760  31787568         0   8193140    100.00      1024 
  53. 01:26:01 AM     96100  32852916     99.71     52668  31734260         8   8193132    100.00      1092 
  54. 01:27:01 AM     91124  32857892     99.72     52796  31699052         0   8193140    100.00       856 

问题分析:

先来说说下交换分区的作用,在操作系统范畴内,交换分区的作用是在物理内存使用完之后,将磁盘空间(也就是SWAP分区)虚拟成内存来使用,换句话说在内存未使用光之前,是不会用到交换分区的,真的是这样吗?下面来看下nagios的内存监控和oracle AWR报告中关于内存方面的信息!

 

 

 

 

 

通过查看nagios内存监控和AWR报告可以很明显的知道,实际内存使用率只到45%左右,可是为什么会用到交换分区呢?而且奇怪的是交换分区使用率到了100%后,oracle照样能正常运行,未收到任何的alert告警信息,如果真的出现内存不足,连接数据库的时候应该会出现类似下图所示的报错信息。

 

问题处理:

于是简单的处理了下这个问题,分别在主备库上敲下面的命令释放交换分区空间,但是问题依旧,过一段时间又会收到报警!

[root@db1 ~]# swapoff -a

[root@db1 ~]# swapon -a

于是参考下面的文章对内核参数进行调整,将swappiness参数从默认的60改为0,告诉操作系统,尽量不要使用交换分区!

http://www.linuxvox.com/2009/10/what-is-the-linux-kernel-parameter-vm-swappiness/

http://blog.yannickjaquier.com/linux/linux-hugepages-and-virtual-memory-vm-tuning.html

后续跟踪:

修改后观察一段时间,交换分区使用率低且并无大幅度增长情况出现!

 本文转自斩月博客51CTO博客,原文链接http://blog.51cto.com/ylw6006/1121888如需转载请自行联系原作者


ylw6006

相关文章
|
20天前
|
Oracle 关系型数据库 数据库
Oracle数据恢复—Oracle数据库文件有坏快损坏的数据恢复案例
一台Oracle数据库打开报错,报错信息: “system01.dbf需要更多的恢复来保持一致性,数据库无法打开”。管理员联系我们数据恢复中心寻求帮助,并提供了Oracle_Home目录的所有文件。用户方要求恢复zxfg用户下的数据。 由于数据库没有备份,无法通过备份去恢复数据库。
|
26天前
|
存储 Oracle 关系型数据库
oracle数据恢复—Oracle数据库文件大小变为0kb的数据恢复案例
存储掉盘超过上限,lun无法识别。管理员重组存储的位图信息并导出lun,发现linux操作系统上部署的oracle数据库中有上百个数据文件的大小变为0kb。数据库的大小缩水了80%以上。 取出&并分析oracle数据库的控制文件。重组存储位图信息,重新导出控制文件中记录的数据文件,发现这些文件的大小依然为0kb。
|
12天前
|
存储 Oracle 关系型数据库
服务器数据恢复—华为S5300存储Oracle数据库恢复案例
服务器存储数据恢复环境: 华为S5300存储中有12块FC硬盘,其中11块硬盘作为数据盘组建了一组RAID5阵列,剩下的1块硬盘作为热备盘使用。基于RAID的LUN分配给linux操作系统使用,存放的数据主要是Oracle数据库。 服务器存储故障: RAID5阵列中1块硬盘出现故障离线,热备盘自动激活开始同步数据,在同步数据的过程中又一块硬盘离线,RAID5阵列瘫痪,上层LUN无法使用。
|
2月前
|
存储 Oracle 关系型数据库
数据库数据恢复—Oracle ASM磁盘组故障数据恢复案例
Oracle数据库数据恢复环境&故障: Oracle ASM磁盘组由4块磁盘组成。Oracle ASM磁盘组掉线 ,ASM实例不能mount。 Oracle数据库故障分析&恢复方案: 数据库数据恢复工程师对组成ASM磁盘组的磁盘进行分析。对ASM元数据进行分析发现ASM存储元数据损坏,导致磁盘组无法挂载。
|
3月前
|
Oracle 关系型数据库 数据库
数据库数据恢复—Oracle数据库文件出现坏块的数据恢复案例
打开oracle数据库报错“system01.dbf需要更多的恢复来保持一致性,数据库无法打开”。 数据库没有备份,无法通过备份去恢复数据库。用户方联系北亚企安数据恢复中心并提供Oracle_Home目录中的所有文件,急需恢复zxfg用户下的数据。 出现“system01.dbf需要更多的恢复来保持一致性”这个报错的原因可能是控制文件损坏、数据文件损坏,数据文件与控制文件的SCN不一致等。数据库恢复工程师对数据库文件进一步检测、分析后,发现sysaux01.dbf文件损坏,有坏块。 修复并启动数据库后仍然有许多查询报错,export和data pump工具使用报错。从数据库层面无法修复数据库。
数据库数据恢复—Oracle数据库文件出现坏块的数据恢复案例
|
3月前
|
Oracle 关系型数据库 数据库
Oracle数据恢复—异常断电导致Oracle数据库数据丢失的数据恢复案例
Oracle数据库故障: 机房异常断电后,Oracle数据库启库报错:“system01.dbf需要更多的恢复来保持一致性,数据库无法打开”。数据库没有备份,归档日志不连续。用户方提供了Oracle数据库的在线文件,需要恢复zxfg用户的数据。 Oracle数据库恢复方案: 检测数据库故障;尝试挂起并修复数据库;解析数据文件。
|
3月前
|
Oracle NoSQL 关系型数据库
主流数据库对比:MySQL、PostgreSQL、Oracle和Redis的优缺点分析
主流数据库对比:MySQL、PostgreSQL、Oracle和Redis的优缺点分析
579 2
|
2月前
|
Oracle 关系型数据库 数据库
oracle数据恢复—Oracle数据库文件损坏导致数据库打不开的数据恢复案例
打开oracle数据库时报错,报错信息:“system01.dbf需要更多的恢复来保持一致性,数据库无法打开”。急需恢复zxfg用户下的数据。 出现上述报错的原因有:控制文件损坏、数据文件损坏、数据文件与控制文件的SCN不一致等。数据恢复工程师对数据库文件做进一步检测分析后发现sysaux01.dbf文件有坏块。修复sysaux01.dbf文件,启动数据库依然有许多查询报错。export和data pump工具无法使用,查询告警日志并分析报错,确认发生上述错误的原因就是sysaux01.dbf文件损坏。由于该文件损坏,从数据库层面无法修复数据库。由于system和用户表空间的数据文件是正常的,
|
7月前
|
SQL Oracle 前端开发
Oracle效率分析,Github标星25K+超火的前端实战项目
Oracle效率分析,Github标星25K+超火的前端实战项目
|
7月前
|
存储 Oracle 关系型数据库
服务器数据恢复—RAID5上层SAP+oracle数据恢复案例
**服务器存储数据恢复环境:** 某品牌服务器存储中有一组由6块SAS硬盘组建的RAID5阵列,其中有1块硬盘作为热备盘使用。上层划分若干lun,存放Oracle数据库数据。 **服务器存储故障&分析:** 该RAID5阵列中一块硬盘出现故障离线,热备盘自动激活替换故障硬盘,热备盘同步数据的过程中该raid5阵列中又有一块硬盘出现故障,RAID5阵列瘫痪,上层LUN无法正常访问。 因为本案例中存储控制器的磁盘检查策略严格,一旦某些磁盘性能不稳定,该型号存储控制器就将该块磁盘识别为坏盘,并将该块磁盘踢出RAID。一旦RAID中掉线的盘数到超过RAID级别允许掉盘的最大数量,该RAID将不可用,
服务器数据恢复—RAID5上层SAP+oracle数据恢复案例