使用云监控和函数计算,秒级恢复故障
云监控发布新feature,打通事件中心和函数服务,可以实现秒级故障恢复。
试想这样一个场景:
当ecs宕机时,在几秒内实现eip自动迁移至另一个健康的ecs实例,快速故障恢复,避免损失。
如何做到?
云监控之前推出了事件中心,定位于,将阿里云上发生的对用户有影响的事件,集中起来,统一展示,统一管理;同时,__可以实现在云产品异常事件发生的第一时间,对用户广播通知,同时打通了事件与函数服务,在事件发生时触发函数计算的执行,快速实现诸如eip迁移,slb带宽扩容,slb摘掉故障服务器等操作,以实现故障的快速恢复__。
Docker监控技术原理和阿里云容器监控服务实践
在云栖社区组织的云栖计算之旅第2期-Docker在云平台上的最佳实践专场中,阿里云晨末做了题为Docker监控原理和阿里云容器监控服务实践的分享。在本次分享中,他谈到了监控的重要性并且针对于Docker容器的监控技术进行了精彩分享。
基于阿里云的 Node.js 稳定性实践
稳定性一般指的是应用持续提供可用服务的能力。一旦应用频繁不可用或出现故障无法及时恢复,对用户的使用体验都是巨大的伤害,甚至会造成很多更严重的后果,因此如何保障应用的稳定性应该是每一个应用开发者都要关注的“头等大事”。本文将介绍基于阿里云的 Node.js 稳定性实践。
云监控 Dashboard上线啦~!
云监控是阿里云的监控与报警产品,为用户提供主要云产品的性能指标监控与报警、业务监控数据处理与报警、站点探测与报警,以及今天要为大家介绍的Dashboard。Dashboard是云监控新推出的一项功能,旨在为用户解决各类监控数据的数据处理与可视化问题。
阿里云 APM 解决方案地图
PM是近5年来伴随着云技术、微服务架构发展起来的一个新兴监控领域。在国内外,无论是云厂商(如AWS, Azure,等)还是独立的公司(Dynatrace, Appdynamics,等),都有着非常优秀的APM产品。