随着数字化升级,设备系统的增多,业务的增长,还有其他林林总总的原因,导致物联网运维人员即使技术过硬,加班加点地维护、探查,也无法实现24*7不间断运维。反而,运维人员所面临的挑战有了许多改变:
1、由于网络不稳定,导致设备间歇性离线状态
2、由于电池容量限制,很多 IoT 设备无法做到24小时在线,设备沉睡处于离线状态
3、由于业务、工时等因素的周期波动,人为的开关机导致进入离线状态
设备的上下线是经常性频繁发生的,这一现状带来一个新的挑战,即:如何有效获知群体设备中出现了在线设备数的异常情况?从而采取措施减少对业务的影响。
此次,阿里云物联网平台增值服务全新发布,新增智能运维服务解决了依靠传统运维无法满足海量设备及丰富指标的运维管理需求。阿里云物联网平台采用基于人工神经网络的智能算法,实时检测设备上报数据,动态计算智能基线及基准区间,取代传统的人工规则的方式对异常数据进行探测和告警,实现24*7无人值守的智慧化运维,可以帮助户客户在第一时间获悉指标异常状态,降低运维风险,提高设备运维效率和质量。
智能运维优势体现在哪些方面?
· 丰富的数据诊断指标
提供网络连接成功率、设备离线原因、云对接次数等丰富的数据诊断指标检测设备,帮助您全方位、多角度分析定位问题。
· 自动拟合智能基线
无需手动配置设备指标异常的阈值,基于设备运行数据,通过机器学习算法自动生成指标智能基线,帮助您识别及智能化管理指标异常的设备。
· 异常检测报警
支持对设备指标进行实时监控,当监控项达到报警阈值,触发报警通知,便于您及时识别设备异常。
智能运维能做什么?
· 诊断指标
可视化展示当前实例下数据诊断指标,包括网络连接成功率、消息到达率、端到云连接耗时等,帮助您查看和分析设备的运行状态。
· 智能基线
基于机器学习算法自动生成指标智能基线,通过智能基线检测异常指标,有效避免静态阈值报警以及误报。
· 设备离线分析
根据设备离线发生的时间区间以及设备的未重连时长统计离线设备的特征,包括离线次数、离线区域分布等,帮助您全面了解、分析离线设备的情况。
· 设备诊断
针对指定设备提供异常项目诊断服务,包括设备离线异常、上下行消息异常、规则流转消息异常等,并根据诊断结果给出相应的排查处理建议。
案例分析
对于单个设备,离线的时刻存在随机性,当把运维统计的视角切换到群组设备时,在线设备数则会呈现规律性。根据历史数据所反应的规律,可以获知异常的设备上下线行为,并进行告警,降低离线损失。
如下图所示,某充电设备企业在线的设备数不断的波动,蕴含随机性的同时也随同工作日时间有规律的起落,在第二天的下午出现了较大范围的掉线情况,AIOPS可以有效发现这一情况,及时告警。
AIOPS智能运维算法通过对设备组的大量历史数据进行自回归建模,利用神经网络抽取历史时序特征,进而指导对当前数据的判断,当发生异常时可以及时告警,并通过短信、钉钉等渠道通知用户,避免不需要的损失。
现新用户首次仅需1分钱即可开通智能运维服务
点击“链接”,登记需求开通
更多物联网平台相关信息
欢迎钉钉扫码入群