开发者社区 问答 正文

云监控主机监控概览

云监控主机监控服务通过在服务器上安装插件,为用户提供服务器的系统监控服务。目前支持Linux操作系统和Windows操作系统。
应用场景
无论您的服务器是阿里云服务器 ECS,还是其他云厂商的服务器或物理机,都可以使用主机监控服务。主机监控服务采集丰富的操作系统层面监控指标,您可以使用主机监控服务进行服务器资源使用情况的查询和排查故障时的监控数据查询。

混合云监控解决方案
云监控通过插件采集用户服务器监控数据,该插件支持安装在非ECS服务器上,解决您云上、云下双重环境的基础监控问题。

企业级用户的监控解决方案
主机监控提供应用分组功能,支持将阿里云不同地域的服务器分配在同一分组中,真正从业务角度管理服务器。同时提供分组维度的报警功能管理能力,一次规则设置可以作用全组,极大提升您的监控运维效率和管理体验。

注意事项

  • 支持Linux操作系统和Windows操作系统,不支持UNIX操作系统。
  • 插件对服务器的消耗:安装包大小75M,安装后200M,内存消耗64M,CPU消耗1%以下。
  • 安装插件需要root权限。
  • TCP状态统计, 类似于Linux下 netstat -anp 命令,当TCP连接过多时,会消耗比较多的CPU时间,所以默认关闭。
    a. 对于Linux操作系统,您可以将cloudmonitor/config/conf.properties配置文件的netstat.tcp.disable改为false来开启采集。修改配置后请重启插件。
    b. 对于Windows操作系统,您可以在C:\”Program Files”\Alibaba\cloudmonitor\config的配置文件中,将netstat.tcp.disable改为false来开启采集。修改配置后请重启插件。

监控能力
云监控会提供CPU、内存、磁盘、网络等三十余种监控项,满足服务器的基本监控运运维需求。 查看支持的全部监控指标


报警能力
云监控对以上所有监控项提供报警功能,您可以选择在单台服务器、应用分组、全部资源三个角度设置报警规则。从业务角度的不同角度出发使用报警功能。
您可以直接在主机监控列表中使用报警功能,也可以将服务器添加到应用分组后,在分组中使用报警功能。

展开
收起
反向一觉 2017-10-31 10:19:49 3883 分享 版权
阿里云 AI 助理回答

阿里云的云监控服务,特别是其主机监控功能,为用户提供了全面且深入的基础架构监控解决方案。以下是对您所提供信息的总结和补充,旨在帮助用户更好地理解和应用这一服务:

主要特点与优势

  1. 广泛兼容性:支持Linux和Windows操作系统,适用于多种服务器环境,无论是阿里云ECS、其他云服务商的服务器,还是本地数据中心的物理机,都能实现统一监控。

  2. 混合云监控:通过在非ECS服务器上安装监控插件,云监控能够跨越云上云下环境,提供一体化的监控视图,有效解决多云及混合云环境下的监控难题。

  3. 企业级管理体验

    • 应用分组:允许用户根据业务需求将不同地域的服务器归类到同一分组中,便于从整体业务角度进行资源管理和监控。
    • 高效报警管理:支持分组维度的报警规则设置,简化运维流程,提高效率,一次设置即可应用于整个分组。
  4. 低侵入性设计:虽然插件对服务器有一定的资源消耗(如内存64MB,CPU小于1%),但相对于其提供的监控价值来说,影响较小。并且,用户可根据需要调整特定监控项(如TCP连接统计)以进一步优化资源使用。

  5. 全面监控指标:覆盖CPU、内存、磁盘I/O、网络流量等关键性能指标,确保系统健康状况的全方位掌握。

  6. 灵活报警机制:针对所有监控指标提供自定义报警规则设置,支持在单个服务器、应用分组或全部资源级别配置,满足不同场景下的告警需求。

实施建议

  • 评估资源影响:在部署前,考虑服务器当前的资源负载情况,确保有足够的资源余量来运行监控插件。
  • 定制化配置:根据实际业务需求,合理开启或关闭特定监控项,比如在处理大量TCP连接的场景下,谨慎开启TCP状态统计以避免额外的CPU负担。
  • 分阶段实施:对于大型企业或复杂环境,建议先从小范围试点开始,逐步验证并优化配置后再推广至全网。
  • 利用报警策略:充分利用报警功能,结合历史数据设定合理的阈值,及时发现并响应潜在问题,提升系统的稳定性和可用性。

通过上述方式,阿里云云监控的主机监控服务能帮助企业有效提升IT基础设施的透明度和可控性,是保障业务连续性和优化资源利用的重要工具。

有帮助
无帮助
AI 助理回答生成答案可能存在不准确,仅供参考
0 条回答
写回答
取消 提交回答