使用云监控和函数计算,秒级恢复故障
云监控发布新feature,打通事件中心和函数服务,可以实现秒级故障恢复。
试想这样一个场景:
当ecs宕机时,在几秒内实现eip自动迁移至另一个健康的ecs实例,快速故障恢复,避免损失。
如何做到?
云监控之前推出了事件中心,定位于,将阿里云上发生的对用户有影响的事件,集中起来,统一展示,统一管理;同时,__可以实现在云产品异常事件发生的第一时间,对用户广播通知,同时打通了事件与函数服务,在事件发生时触发函数计算的执行,快速实现诸如eip迁移,slb带宽扩容,slb摘掉故障服务器等操作,以实现故障的快速恢复__。
阿里云监控grafana数据源使用说明文档
一. grafana安装
如果服务器上没有安装grafana,需要在服务器上安装grafana。
grafana卸载:
1.1 查看grafana安装情况
rpm -qa | grep -i grafana
1.
弹性计算双周刊 第 10 期
GPU云服务器支持一键增加GPU监控和报警功能,大大提升用户体验。ECS全新一代超高性能ESSD云盘产品正式上线公测,当前已在华北2(北京)可用区G提供公测资源。欢迎通过工单申请公测资格,进行购买试用!
云监控 Dashboard上线啦~!
云监控是阿里云的监控与报警产品,为用户提供主要云产品的性能指标监控与报警、业务监控数据处理与报警、站点探测与报警,以及今天要为大家介绍的Dashboard。Dashboard是云监控新推出的一项功能,旨在为用户解决各类监控数据的数据处理与可视化问题。
车联网上云最佳实践(二)
我们对传统IDC应用架构进行分析之后,我们发现之前的系统架构存在一些不合理的地方导致了很多的痛点,为了解决这些痛点我们最终考虑上云。开始思考怎样利用云上产品来解决目前遇到的痛点。例如
放心过年的正确姿势:云监控开启一键报警
监控年关,运维同学最关心的是什么? 服务千万不要挂,不过服务永远不挂是不可能的。重点是,服务异常了,你可以及时被通知到,以便快速做出反应,及时修复问题。
一句话,让云监控通知你,而不是让老板通知你。
然而,越来越多的企业上云,使用越来越多的服务、产品,这些产品运维的好不好?有没有风险?如果有风险,我如何能知道?这么多产品,这么多机器,我怎么能快速的甚至一键的弄一个简单监控,满足的需求?
好吧, 云监控赶在年前,推出了一键报警功能, 可以一键开启对[ecs,rds,slb,redis,mongodb,hbase]等6个产品的所有实例的监控,注意是所有实例。