阿里云-进程监控与告警

简介: 1.背景 我在阿里云ECS上部署了个人网站,用到了mysql与tomcat,所以想要分钟级监控这两个进程是否alive。 2.安装监控agent 安装说明:https://help.aliyun.com/knowledge_detail/38859.html 进入阿里云控制台,产品与服务|监控与管理|云监控|云服务监控|云服务器ECS|单击实例ID,即可见到图2-1.

1.背景

我在阿里云ECS上部署了个人网站,用到了mysql与tomcat,所以想要分钟级监控这两个进程是否alive。

2.安装监控agent

进入阿里云控制台, 产品与服务|监控与管理|云监控|云服务监控|云服务器ECS|单击实例ID,即可见到图2-1.

图2-1
如果图表有缺失,按照提示安装监控agent。它会定时收集系统信息并上报给阿里云后台。

3.添加进程监控

见图3-1。


图3-1
完整进程名称通过 ps aux得到,包含进程名称及启动参数。
注意:这里只需要填写 关键字即可,如果 完整进程名称. contains(关键字) ,那么此关键字下的进程计数就+1。
添加后等待3分钟即可有数据显示。见图3-2.

图3-2

4设置告警规则

见图4-1.

图4-1.

5.告警效果

手机阿里云会提示有告警,见图5-1。且 会收到短信,不用担心错过。


图5-1
目录
相关文章
|
9月前
|
弹性计算 监控 数据安全/隐私保护
阿里云ECS云监控界面
阿里云ECS云监控界面
1087 2
|
1月前
|
Web App开发 监控 网络协议
网络分析与监控:阿里云拨测方案解密
阿里云网络拨测业务提供了全球、多种协议、多种网络态势的用户网络性能和用户体验监控场景的全面可观测方案。该文章从拨测场景下,介绍了用户如何快速的构建一套全球用户视角的服务可用性大盘,为客户的业务保驾护航。
152 10
|
8月前
|
监控 Linux 应用服务中间件
探索Linux中的`ps`命令:进程监控与分析的利器
探索Linux中的`ps`命令:进程监控与分析的利器
167 13
|
9月前
|
缓存 监控 调度
第六十一章 使用 ^PERFSAMPLE 监控进程 - 分析维度
第六十一章 使用 ^PERFSAMPLE 监控进程 - 分析维度
56 0
|
5月前
|
监控
MASM32写的免费软件“ProcView/系统进程监控” V1.4.4003 说明和下载
MASM32写的免费软件“ProcView/系统进程监控” V1.4.4003 说明和下载
|
5月前
|
监控 Ubuntu API
Python脚本监控Ubuntu系统进程内存的实现方式
通过这种方法,我们可以很容易地监控Ubuntu系统中进程的内存使用情况,对于性能分析和资源管理具有很大的帮助。这只是 `psutil`库功能的冰山一角,`psutil`还能够提供更多关于系统和进程的详细信息,强烈推荐进一步探索这个强大的库。
75 1
|
6月前
|
数据采集 监控 API
如何监控一个程序的运行情况,然后视情况将进程杀死并重启
这篇文章介绍了如何使用Python的psutil和subprocess库监控程序运行情况,并在程序异常时自动重启,包括多进程通信和使用日志文件进行断点重续的方法。
|
6月前
|
机器学习/深度学习 人工智能 运维
"颠覆传统运维!揭秘阿里云AIGC如何化身运维界超级大脑,让故障预警、智能告警不再是梦,运维大神之路从此开启!"
【8月更文挑战第14天】随着AI技术的发展,AIGC正革新依赖人工经验的传统运维行业。阿里云凭借其领先的云计算能力和AI服务生态,为运维智能化提供了坚实基础。通过分析历史数据和系统日志,AIGC能自动发现并预测故障,大幅提升运维效率。例如,结合阿里云SLS和PAI,可构建智能告警系统,实现异常检测和实时预警。随着AIGC技术的进步,运维领域将迎来全面智能化转型,开启运维新时代。
184 3
|
7月前
|
测试技术 持续交付 对象存储
阿里云云效产品使用合集之健康检查是否可以探测到失败的进程的
云效作为一款全面覆盖研发全生命周期管理的云端效能平台,致力于帮助企业实现高效协同、敏捷研发和持续交付。本合集收集整理了用户在使用云效过程中遇到的常见问题,问题涉及项目创建与管理、需求规划与迭代、代码托管与版本控制、自动化测试、持续集成与发布等方面。
|
9月前
|
弹性计算 监控 安全
【阿里云弹性计算】ECS实例监控与告警系统构建:利用阿里云监控服务保障稳定性
【5月更文挑战第23天】在数字化时代,阿里云弹性计算服务(ECS)为业务连续性提供保障。通过阿里云监控服务,用户可实时监控ECS实例的CPU、内存、磁盘I/O和网络流量等指标。启用监控,创建自定义视图集中显示关键指标,并设置告警规则(如CPU使用率超80%),结合多种通知方式确保及时响应。定期维护和优化告警策略,利用健康诊断工具,能提升服务高可用性和稳定性,确保云服务的卓越性能。
287 1

热门文章

最新文章