PostgreSQL 实时健康监控 大屏 - 高频指标(服务器)

本文涉及的产品
云原生数据库 PolarDB 分布式版,标准版 2核8GB
云数据库 RDS PostgreSQL,高可用版 2核4GB 50GB
云原生数据库 PolarDB MySQL 版,Serverless 5000PCU 100GB
简介:

标签

PostgreSQL , 大屏指标 , qps , long query , locks , active , idle in transaction , long idle in transaction , 2PC


背景

最关键的一些数据库健康指标,趋势监测。

1 CPU

1,5,15分钟平均负载,超过CPU核数时,较高,需要关注优化或拆库或加资源。

uptime  
 21:29:36 up 36 days, 10:46,  2 users,  load average: 0.00, 0.75, 1.25  

2 IO读写吞吐

man iostat看所有指标含义

iostat -x 1  
Linux 3.10.0-693.2.2.el7.x86_64 (iZbp13nu0s9j3x3op4zpd4Z)       06/13/2018      _x86_64_        (56 CPU)  
  
avg-cpu:  %user   %nice %system %iowait  %steal   %idle  
           0.32    0.00    0.14    0.02    0.00   99.52  
  
Device:         rrqm/s   wrqm/s     r/s     w/s    rkB/s    wkB/s avgrq-sz avgqu-sz   await r_await w_await  svctm  %util  
vda               0.00     0.08    0.03    0.23     1.01     5.63    51.49     0.01   32.23    8.77   35.39   0.64   0.02  
vdb               0.00     1.32    0.03   10.28     9.84  1123.44   219.71     0.14   13.82    7.63   13.84   0.17   0.18  
vdc               0.00     0.39    0.05    1.56     7.25   183.56   237.36     0.00    0.94    1.34    0.93   0.10   0.02  

3 读写IOPS

都来自iostat

4 读写IO响应延迟

都来自iostat

5 block device UTIL

都来自iostat

100%表示BLOCK设备已非常繁忙,需要加资源,比如换SSD。

6 内存

Documentation/filesystems/proc.txt

可用内存

脏页

页表大小

cat /proc/meminfo   
MemTotal:       230943368 kB  
MemFree:         1177172 kB  
MemAvailable:   218722632 kB  可用内存  
Buffers:          559332 kB  
Cached:         222984788 kB  
SwapCached:            0 kB  
Active:         123800268 kB  
Inactive:       99803032 kB  
Active(anon):    1934628 kB  
Inactive(anon):  7540356 kB  
Active(file):   121865640 kB  
Inactive(file): 92262676 kB  
Unevictable:           0 kB  
Mlocked:               0 kB  
SwapTotal:             0 kB  
SwapFree:              0 kB  
Dirty:              2208 kB  脏页  
Writeback:             0 kB  
AnonPages:         59560 kB  
Mapped:          6962900 kB  
Shmem:           9415496 kB  
Slab:            4724068 kB  
SReclaimable:    4567004 kB  
SUnreclaim:       157064 kB  
KernelStack:        8816 kB  
PageTables:        29400 kB  页表大小  
NFS_Unstable:          0 kB  
Bounce:                0 kB  
WritebackTmp:          0 kB  
CommitLimit:    207849028 kB  
Committed_AS:   69435832 kB  
VmallocTotal:   34359738367 kB  
VmallocUsed:      432284 kB  
VmallocChunk:   34359294992 kB  
HardwareCorrupted:     0 kB  
AnonHugePages:         0 kB  
HugePages_Total:       0  
HugePages_Free:        0  
HugePages_Rsvd:        0  
HugePages_Surp:        0  
Hugepagesize:    1048576 kB  
DirectMap4k:      120700 kB  
DirectMap2M:     4073472 kB  
DirectMap1G:    232783872 kB  

6 网络

收发带宽

dstat

dstat  
You did not select any stats, using -cdngy by default.  
----total-cpu-usage---- -dsk/total- -net/total- ---paging-- ---system--  
usr sys idl wai hiq siq| read  writ| recv  send|  in   out | int   csw   
  0   0 100   0   0   0|  18k 1313k|   0     0 |   0     0 |3183  6612   
  0   0 100   0   0   0|   0     0 | 402B  770B|   0     0 | 414   307   

7 D状态进程数

ps -axo stat|grep -c "D"  
0  

8 硬盘健康状态,SSD剩余寿命

smartctl 或 SSD硬件厂商提供的状态监测软件  

8 服务器硬件错误

如果有内容,需要维修硬件。

cat /var/log/mcelog

9 网卡速率状态变化

观测由于网线或交换机或网卡接口问题导致的速率变化

ethtool eth0
...
ethtool ethn

10 文件系统

1、剩余空间

df -h

2、剩余inode

df -i

参考

《Use PostgreSQL collect and analyze Operation System statistics》

相关实践学习
使用PolarDB和ECS搭建门户网站
本场景主要介绍基于PolarDB和ECS实现搭建门户网站。
阿里云数据库产品家族及特性
阿里云智能数据库产品团队一直致力于不断健全产品体系,提升产品性能,打磨产品功能,从而帮助客户实现更加极致的弹性能力、具备更强的扩展能力、并利用云设施进一步降低企业成本。以云原生+分布式为核心技术抓手,打造以自研的在线事务型(OLTP)数据库Polar DB和在线分析型(OLAP)数据库Analytic DB为代表的新一代企业级云原生数据库产品体系, 结合NoSQL数据库、数据库生态工具、云原生智能化数据库管控平台,为阿里巴巴经济体以及各个行业的企业客户和开发者提供从公共云到混合云再到私有云的完整解决方案,提供基于云基础设施进行数据从处理、到存储、再到计算与分析的一体化解决方案。本节课带你了解阿里云数据库产品家族及特性。
相关文章
|
2月前
|
机器学习/深度学习 搜索推荐 算法
推荐系统离线评估方法和评估指标,以及在推荐服务器内部实现A/B测试和解决A/B测试资源紧张的方法。还介绍了如何在TensorFlow中进行模型离线评估实践。
推荐系统离线评估方法和评估指标,以及在推荐服务器内部实现A/B测试和解决A/B测试资源紧张的方法。还介绍了如何在TensorFlow中进行模型离线评估实践。
306 0
|
存储 SQL 监控
22 PostgreSQL 监控3PostgreSQL 性能快照和图形化分析工具 pg_stats_info 的使用|学习笔记
快速学习22 PostgreSQL 监控3PostgreSQL 性能快照和图形化分析工具 pg_stats_info 的使用
990 0
22 PostgreSQL 监控3PostgreSQL 性能快照和图形化分析工具 pg_stats_info 的使用|学习笔记
|
2天前
|
弹性计算 Prometheus Cloud Native
ECS管控中的指标分层规范是怎样的
ECS管控中的指标分层规范是怎样的
11 4
|
10天前
|
SQL 监控 关系型数据库
实时计算 Flink版操作报错合集之在设置监控PostgreSQL数据库时,将wal_level设置为logical,出现一些表更新和删除操作报错,怎么办
在使用实时计算Flink版过程中,可能会遇到各种错误,了解这些错误的原因及解决方法对于高效排错至关重要。针对具体问题,查看Flink的日志是关键,它们通常会提供更详细的错误信息和堆栈跟踪,有助于定位问题。此外,Flink社区文档和官方论坛也是寻求帮助的好去处。以下是一些常见的操作报错及其可能的原因与解决策略。
|
2天前
|
存储 弹性计算 运维
ECS管控中的度量指标数据是如何存储的
ECS管控中的度量指标数据是如何存储的
6 0
|
11月前
|
存储 弹性计算 编解码
阿里云倚天云服务器全方位介绍(市场背景、产品技术、指标数据等)
倚天云服务器是阿里云目前非常热门的云服务器产品,也是阿里云在2023年主推的系列云服务器,目前倚天云服务器包括计算型c8y、通用型g8y、内存型r8y等实例规格,倚天云服务器采用阿里自研倚天710处理器,基于最新一代CIPU和Dragonfly ARM Hypervisor ,通过芯片快速路径加速手段实现计算、存储、网络性能的大幅提升。本文介绍阿里云倚天云服务器推出的市场背景、倚天云服务器的产品技术如何以及倚天云服务器的各项指标数据情况。
983 0
阿里云倚天云服务器全方位介绍(市场背景、产品技术、指标数据等)
|
10月前
|
关系型数据库 分布式数据库 数据库
沉浸式学习PostgreSQL|PolarDB 8: 电商|短视频|新闻|内容推荐业务(根据用户行为推荐相似内容)、监控预测报警系统(基于相似指标预判告警)、音视图文多媒体相似搜索、人脸|指纹识别|比对 - 向量搜索应用
1、在电商业务中, 用户浏览商品的行为会构成一组用户在某个时间段的特征, 这个特征可以用向量来表达(多维浮点数组), 同时商品、店铺也可以用向量来表达它的特征. 那么为了提升用户的浏览体验(快速找到用户想要购买的商品), 可以根据用户向量在商品和店铺向量中进行相似度匹配搜索. 按相似度来推荐商品和店铺给用户. 2、在短视频业务中, 用户浏览视频的行为, 构成了这个用户在某个时间段的兴趣特征, 这个特征可以用向量来表达(多维浮点数组), 同时短视频也可以用向量来表达它的特征. 那么为了提升用户的观感体验(推荐他想看的视频), 可以在短视频向量中进行与用户特征向量的相似度搜索.
268 0
|
存储 机器学习/深度学习 Dragonfly
阿里云服务器c8y、g8y、r8y实例性能、指标数据及最新价格分享
继推出轻量应用服务器与通用算力型u1、计算型c7、通用型g7和内存型r7实例云服务器优惠之后,阿里云服务器优惠上新品了,性价比最高的c8y、g8y、r8y云服务器7.2折,购买时长最高可选5年,c8y、g8y、r8y云服务器采用阿里自研倚天710处理器,基于最新一代CIPU和Dragonfly ARM Hypervisor ,通过芯片快速路径加速手段实现计算、存储、网络性能的大幅提升。下面小编来详细介绍下这几款云服务器的实例性能、指标数据及可选配置和优惠价格情况。
阿里云服务器c8y、g8y、r8y实例性能、指标数据及最新价格分享
|
前端开发 数据可视化
漏刻有时数据可视化大屏常见问题(2):Ajax获取服务器数据出错了![object Object]
漏刻有时数据可视化大屏常见问题(2):Ajax获取服务器数据出错了![object Object]
158 0
|
监控 Cloud Native 关系型数据库
《阿里云认证的解析与实战-数据仓库ACP认证》——云原生数据仓库AnalyticDB PostgreSQL版解析与实践(下)——二、监控报警使用、监控巡检
《阿里云认证的解析与实战-数据仓库ACP认证》——云原生数据仓库AnalyticDB PostgreSQL版解析与实践(下)——二、监控报警使用、监控巡检

相关产品

  • 云原生数据库 PolarDB