开发者社区 > 弹性计算 > 云服务器ECS > 正文

大规模 ECS 出现 CPU 负载异常导致业务整体不可用,如何处理?

已解决

大规模 ECS 出现 CPU 负载异常导致业务整体不可用,如何处理?

展开
收起
游客lmkkns5ck6auu 2022-10-20 13:06:38 634 0
1 条回答
写回答
取消 提交回答
  • 推荐回答

    处理方案 • 提前预案 根据阿里云提供全链路评估报告梳理 ECS 安全组规则,收敛存在安全风险 的策略,如收敛 0.0.0.0/0 规则。 核心业务服务器请安装安骑士,及时修补服务器安全风险及漏洞。

    • 恢复预案 登录异常 ECS,通过 TOP 命令看看是否存在陌生进程占用大量 CPU,判断 有可能被暴力破解并部署挖矿程序,需要及时切彻底删除木马程序。 如业务进程占用 CPU 最高,可尝试重启应用优先恢复业务。 通过快照进行恢复到之前的状态。

    以上内容摘自《企业运维之弹性计算原理与实践》电子书,点击https://developer.aliyun.com/ebook/download/7779 可下载完整版

    2022-10-20 19:16:39
    赞同 展开评论 打赏

云服务器ECS是一种安全可靠、弹性可伸缩的IaaS级云计算服务。在这里你可以获取最新的ECS产品资讯、最前沿的技术交流以及优惠活动等信息,加速自己的技术成长。

相关产品

  • 云服务器 ECS
  • 相关电子书

    更多
    云服务器可观测能力的探索与实践 立即下载
    大规模云服务器高效使用及管理最佳实践 立即下载
    RDS SQL Server CPU高使用率性能优化 立即下载