《Greenplum5.0 最佳实践》 系统监控与维护 (五)

简介:

常规的系统维护是为了我们的Greenplum数据库具有更高的稳定性和更优化的性能体现

  1. 使用 ANALYZE 更新系统的统计信息
  2. 数据库的数据膨胀管理 (需要仔细点延伸下去)
  3. 监控Greenplum的日志文件

Monitoring (监控)

Greenplum 数据库系统提供了非常使用的监控工具。
gp_toolkit 模式包含多种视图,可以通过SQL命令去查询Greenplum数据库系统的 system catalogs , log files 和 对当前操作环境下系统的状态信息。
对于更多的 gpstategpcheckperf 涉及在 《Greenplum Database Utility Guide》中。对于 gp_toolkit 的信息, 可以参考 《Greenplum Database Reference Guide》

gpstate

使用 gpstate 实用程序是用来查看Greenplum 整个系统状态的。 通常,我们执行 gpstate 命令会获得如下信息,这些信息包裹当前有多少个段数据库在运行,多少个段数据挂掉了,如果存在数据库挂掉了,这就需要我们注意解决问题了,因为挂点的点很容易引起计算倾斜等问题。
执行 gpstate -Q 可以获取在 master 节点的 system catalog 中有多少个段数据库 DOWN (宕机了)。
如果想获得更详细的信息需要执行的命令为 gpstate -s

gpcheckperf

gpcheckperf 时用用来检测硬件的性能的,所有的节点。可以用来确定硬件故障,它的性能检查涉及到如下几条:

  1. 磁盘 I/O检测 -- 使用的是 linux 系统命令 dd 读写大的日志文件,来获得磁盘的性能。 他返回结果为 读写 MB/sec
  2. 内存带宽测试 -- 是使用的是 STREAM benchmark 来测试,其单位为 MB/sec

    计算公式为 带宽=内存核心频率×内存总线位数×倍增系数
  3. 网络性能测试 -- 运行的是 gpnetbench 网络测试的 benchmark (可以选择为 netperf) 来测试集群的网络性能。 这个benchmark 运行在三种模式下,分别是 并行对测试 (-r N), 串口对测试 ( -r n), 全矩阵测试 ( -r M)。这里会获得 最小 最大 平均 和 中值 的转换率 单位是 MB/sec

为了使用 gpcheckperf 获得有用的数据, 数据库系统必须 停机 才可以。如果不停机的话,很多获得数据根本不可靠。
使用 gpcheckperf 要求在测试的主机之间建立可靠的主机设置机制。他将会调用 gpsshgpscp 命令, 所以必须确保这些命令完全在你的系统 PATH 中。 可以使用如下命令检查是否可以使用 ( -h host1 -h host2) 等。或者使用 (-f host_file) 这是一个 text 文件。里面的内容就是各个主机名。

通常情况下, gpcheckperf 运行的测试为 I/O 测试, 内存测试, 串口测试 网络测试。 在磁盘 I/O 测试的时候,我们需要的是 使用 -d 参数来选择具体的系统上的文件路径。 如下例子


$gpcheckperf -f subnet_1_hosts -d /data1 -d /data2 -r ds

其中这上面的 -r 参数是用来选择运行在 : 磁盘I/O (d), 内存带宽 (s) , 网络并行对 (N), 网络串行对 (n), 网络全矩阵测试 (M).
这有网络测试模式可以选择执不执行 . 具体参见 ‘《Greenplum Database Reference Guide》

## 监控操作系统
通常使用如下命令来监控操作系统

  1. iostat 允许可以监控每个段节点磁盘的使用情况
  2. top 动态视图的形式显示操作系统的进程情况
  3. vmstate 展示内存使用情况

通常是使用 gpssh 切换到不同的节点上去查看检测信息

最佳实践

  1. 参看 《Greenplum Database Administrator Guide》 完成监控任务的部署和实现。
  2. 在安装Greenplum 数据库之前先执行一次 gpfcheckperf , 保存输出结果,此后不定期的执行测试
  3. 使用你能找到的所有工具来了解在不同负载的情况下,系统的状态
  4. 检查任何异常事件以确保原因
  5. 通过定期运行 explain 命令来获得查询的解释计划, 监控系统上的查询活动, 以确保运行最佳。
  6. 审视执行计划,以确保是否使用了索引,并按照预期完成分区的选择

附加信息

gpcheckperf 参看手册 《Greenplum Database Utility Guide》
维护系统的搭建 参考手册 《Greenplum Database Administrator Guide》
Sustainable Memory Bandwidth in Current High Performance Computers. John D. McCalpin. Oct 12, 1995.http://www.cs.virginia.edu/~mccalpin/papers/bandwidth/bandwidth.html
www.netperf.org to use netperf, netperf must be installed on each host you test. See gpcheckperf reference for more information.

目录
相关文章
|
SQL 分布式计算 数据库
【大数据技术Spark】Spark SQL操作Dataframe、读写MySQL、Hive数据库实战(附源码)
【大数据技术Spark】Spark SQL操作Dataframe、读写MySQL、Hive数据库实战(附源码)
917 0
|
7月前
|
负载均衡 监控 安全
5 个 IIS 日志记录最佳实践
IIS日志记录是监控Web服务器性能与安全的关键。本文介绍启用日志、应用池配置、负载均衡、敏感数据防护、日志集中管理及保留策略等五大最佳实践,助力高效分析与合规审计。
407 1
|
存储 弹性计算 数据管理
阿里云对象存储OSS收费标准,存储、流量和请求等多个计费项
阿里云对象存储OSS收费标准涵盖存储、流量及请求费用,提供按量付费和包年包月两种模式。标准型OSS按量付费为0.09元/GB/月,包年包月40GB仅9元/年,500GB优惠价118元/年。流量费仅收取公网流出方向,内网流入流出免费。
1209 13
|
机器学习/深度学习 运维 数据可视化
《生成对抗网络:网络安全态势感知可视化的新引擎》
在数字化时代,网络安全至关重要。网络安全态势感知可视化通过直观展示网络状况,帮助快速发现威胁。生成对抗网络(GANs)作为前沿AI技术,正为这一领域带来变革。GANs由生成器和判别器组成,通过对抗训练生成逼真数据,用于数据增强、异常检测、威胁情报合成及动态场景模拟。尽管面临数据隐私、模型稳定性和可解释性等挑战,GANs的应用前景广阔,有望大幅提升网络安全水平。
566 22
|
SQL 存储 关系型数据库
技术心得记录:数仓建模方法之范式建模、ER实体建模、维度建模
技术心得记录:数仓建模方法之范式建模、ER实体建模、维度建模
1331 1
|
缓存 开发工具 git
Git创建分支以及合并分支
在Git中,创建分支使用`git branch [branch_name]`,切换分支使用`git checkout [branch_name]`。修改文件后,通过`git add [file]`添加到暂存区,然后`git commit`提交到本地仓库。如果是新建分支的第一次推送,使用`git push origin [branch_name]`推送到远程仓库,之后可以简化为`git push`。合并分支时,使用`git merge [branch_name]`将指定分支的更改合并到当前分支。
616 2
Git创建分支以及合并分支
|
存储 缓存 NoSQL
京东面试:亿级黑名单 如何设计?亿级查重 呢?(答案含:布隆过滤器、布谷鸟过滤器)
尼恩,40岁的老架构师,近期在读者交流群中分享了几个大厂面试题及其解决方案。这些问题包括亿级数据查重、黑名单存储、电话号码判断、安全网址判断等。尼恩给出了三种解决方案:使用BitMap位图、BloomFilter布隆过滤器和CuckooFilter布谷鸟过滤器。这些方法不仅高效,还能显著提升面试表现。尼恩还建议大家系统化学习,刷题《尼恩Java面试宝典PDF》,并提供简历修改和面试辅导,帮助大家实现“offer自由”。更多技术资料和PDF可在公众号【技术自由圈】获取。
|
小程序 安全 数据挖掘
陪玩语聊APP小程序定制开发模块功能
随着电竞行业的规范化,游戏陪玩软件兴起,提供专业陪玩服务。核心功能包括:多样化注册登录、用户资料展示、智能匹配筛选陪玩、语音互动(多人/私聊)、订单交易管理、陪玩入驻审核、数据分析、客服系统及社交功能。旨在融合游戏、语音聊天与社交,构建综合娱乐平台。
|
分布式计算 Hadoop 网络安全
|
负载均衡 Java 应用服务中间件
一文速通Nginx网关与gateway网关区分
一文速通Nginx网关与gateway网关区分