阿里云资深用户_个人页

个人头像照片 阿里云资深用户
个人头像照片
4
0
0

个人介绍

暂无个人介绍

擅长的技术

  • 稳定性
  • ecs
获得更多能力
通用技术能力:

暂时未有相关通用技术能力~

云产品技术能力:

暂时未有相关云产品技术能力~

阿里云技能认证

详细说明
暂无更多信息

2024年09月

  • 09.09 16:52:33
    发表了文章 2024-09-09 16:52:33

    如何结合ECS业务故障演练

    故障演练是提升系统稳定性的关键手段,通过向系统注入可控故障,验证并增强系统的高可用性,训练应急响应能力,减少实际故障恢复时间(MTTR)。阿里云提供ECS故障注入插件`ecs-fault-{scenename}`或`ACS-ECS-{scenename}`,简化演练过程,提升效果与效率。该插件免费开源,操作便捷,支持多种故障场景模拟,如服务器宕机、CPU利用率高、内存溢出(OOM)等,帮助企业快速验证和优化故障应对策略。
  • 09.09 16:51:34
    发表了文章 2024-09-09 16:51:34

    宕机自动恢复服务

    在服务或脚本运行过程中,可能会因为程序异常、服务器重启或掉电等原因停止运行,导致业务受损。通过使用云助手插件 `ecs-tool-servicekeepalive`,可以在服务或脚本被中断时快速恢复运行,确保其可靠性和持续性。该插件基于 Linux 系统的 systemd service 实现,用户只需输入启动命令即可自动生成 systemd service 配置,无需手动配置。具体实践包括启动插件、查看配置状态及取消自恢复等功能。
  • 09.09 16:50:02
    发表了文章 2024-09-09 16:50:02

    自动化监控和响应ECS系统事件

    阿里云提供的ECS系统事件用于记录云资源信息,如实例启停、到期通知等。为实现自动化运维,如故障处理与动态调度,可使用云助手插件`ecs-tool-event`。该插件定时获取并转化ECS事件为日志存储,便于监控与响应,无需额外开发,适用于大规模集群管理。详情及示例可见链接文档。
  • 09.09 16:45:51
    发表了文章 2024-09-09 16:45:51

    用户怎么用ECS最稳定

    阿里云ECS提供了多种优化系统稳定性的实践方案,包括最佳实践指南、利用云助手插件实现系统事件的自动监控与响应、服务自动恢复机制以及故障演练策略,有效提升系统的可靠性和维护效率。了解详情及应用指引,请访问上述链接。
  • 发表了文章 2024-09-09

    宕机自动恢复服务

  • 发表了文章 2024-09-09

    如何结合ECS业务故障演练

  • 发表了文章 2024-09-09

    自动化监控和响应ECS系统事件

  • 发表了文章 2024-09-09

    用户怎么用ECS最稳定

正在加载, 请稍后...
滑动查看更多
正在加载, 请稍后...
暂无更多信息
正在加载, 请稍后...
暂无更多信息