使用云监控和函数计算,秒级恢复故障
云监控发布新feature,打通事件中心和函数服务,可以实现秒级故障恢复。
试想这样一个场景:
当ecs宕机时,在几秒内实现eip自动迁移至另一个健康的ecs实例,快速故障恢复,避免损失。
如何做到?
云监控之前推出了事件中心,定位于,将阿里云上发生的对用户有影响的事件,集中起来,统一展示,统一管理;同时,__可以实现在云产品异常事件发生的第一时间,对用户广播通知,同时打通了事件与函数服务,在事件发生时触发函数计算的执行,快速实现诸如eip迁移,slb带宽扩容,slb摘掉故障服务器等操作,以实现故障的快速恢复__。
基于阿里云的 Node.js 稳定性实践
稳定性一般指的是应用持续提供可用服务的能力。一旦应用频繁不可用或出现故障无法及时恢复,对用户的使用体验都是巨大的伤害,甚至会造成很多更严重的后果,因此如何保障应用的稳定性应该是每一个应用开发者都要关注的“头等大事”。本文将介绍基于阿里云的 Node.js 稳定性实践。
云监控--3分钟帮你实现日志关键字报警
在企业级的业务运维和运营场景中, 日志正扮演着越来越重要的角色。但使用传统日志采集与分析方案ELK和监控界的老大哥Zabbix就面临着需要投入大量时间和人力搭建庞大的攻城武器、付出沉重的运维成本的问题,实在有点得不偿失。
车联网上云最佳实践(二)
我们对传统IDC应用架构进行分析之后,我们发现之前的系统架构存在一些不合理的地方导致了很多的痛点,为了解决这些痛点我们最终考虑上云。开始思考怎样利用云上产品来解决目前遇到的痛点。例如