阿里云IoT设备运维基础——监控报警介绍(一)|学习笔记

本文涉及的产品
云监控,每月短信1000条
简介: 快速学习阿里云IoT设备运维基础——监控报警介绍(一)

开发者学堂课程【物联网平台实操入门:阿里云IoT设备运维基础——监控报警介绍(一)】学习笔记与课程紧密联系,让用户快速学习知识

课程地址https://developer.aliyun.com/learning/course/1031/detail/15127


阿里云IoT设备运维基础——监控报警介绍(一)


内容介绍:

一、设备运维监控报警介绍

二、实时监控大盘

三、监控报警规则管理


一、设备运维监控报警介绍

本节课讲解的是阿里云IoT的基础产品功能——基础的监控报警,会按照以下几个步骤进行,首先介绍平台设备运维监控报警基础的背景,可能会占大部分的内容,中间三块是具体的产品功能的介绍,因为产品报警的概念或者是功能和理解的背景不会有太大的出入,最后介绍一下未来监控报警的产品规划。

1、IoT的物联网平台以及设备运维监控报警的关系

首先讲解IoT的物联网平台以及设备运维监控报警大概是怎样的关系。

物联网平台是服务各产业实体的设备端完成数字化,上云开展自己的业务,完成这样衔接的工作。

之前在互联网时代说的是要上网,经常听到的是这么巧,你也在网上冲浪互联网时代经常说类似的话。互联网上网更多的是人通过PC或者是移动设备接入到互联网,访问互联网上的信息。

现在喊的口号叫上云,以后在网上碰到可能会说这么巧你也在网上翻跟头,上云与上网很大的区别是要将业务设计过程中的不只是人包括物就是生产过程中设计的设备进行数字化接入到云数字化的引擎上面。接入到云数字化引擎的好处一个是接上云后可以享受云上更强大更实惠的服务能力,将以前做不到的变成现实,以前做成功的事情变得更成功更平易一点。

强大体现在一方面资源设备是受限的与PC不同设备需要买成千上万的设备花费比较大,云上有强大的计算能力、存储能力、数据能力和算法能力都可以使数据变得更快。

以前中国古代神话里经常说的一句话是天上一天地上一年,说的就是这个道理在云上一天能干完的事情在地下可能做一年,还有一点是云上可以使做的事情更平易,体现在一个是集中化来提供服务能力资源采购可能像是批发具有成本优势,资源的利用率可以通过先进的虚拟化隔离技术来进行资源调配,可以使成本利用率变得更高,比如个人买个PC机就只刷贴吧,剩下没有用掉的其实是亏掉的。云上可以做到按量付费。设备上云除了可以享受到云上强大和平易的引擎能力之外,还有就是设备为什么要上云有能力要去做什么,设备上云之后可以建立数字化通道,可能以前需要人去跑腿去操作才能完成的事情需要尽量减少,可以减少人力投入可以更快地完成操作,比如设备的巡检、电机的巡检都不需要人实际去跑。

2、物联网平台里主要的功能模块

接下来看物联网平台里主要的几个功能模块,前面可能看过介绍这里在进行解答因为比较重要,第一块是设备接入连接是为了建立通信的通道类比于上网之前需要宽带或者是蜂窝网来进行上网,第二块比较核心的是设备的建模管理即定义设备数字化的物模型,物模型之所以重要类比上网的过程物模型相当于上网访问网页时定义的web标准htmm、css,有了web标准不同的网站才可以开发成不同的样子完成不同的功能用途,上网时的信息交互更方便,如果没有这个过程上网和打电话没有区别,以前没有网页的时候也可以发短信、打电话来订票,现在来看之前很落后的机制都被淘汰了,因此物模型很重要。物模型使设备数字化之后接口变得更丰富、更标准、更易用、更易于复制、更易于达成行业的统一理解,接入之后数字化上云的效率变得更高更方便。

还有一块功能是数据流转,对应着上网其实是上网的数据流量,交互产生事件数据,上传下载文件,数据流转也可以完成设备事件消息流转,也可以帮助将相关的数据流转到阿里云上边的云产品,比如存储相关的RDS等。从物联网平台到设备运维,设备运维是一个很像的模块,它可能不是在主要的运行设备里参与的,但是会解决很大一部分问题。

设备运维是非常关键的因为先不看数据具体上云之后要完成什么样的业务场景,首先设备是一个物理的设备在自己的生命周期中需要运行维护,所以运维的能力是一个很基础很通用的诉求,比如买了台车先不要管开到哪去不要管拉什么货,需要有定期的保养计划,因此车里会有很多相应的仪表并且还会帮助提供对应的警报比如有没有超速油有没有用完胎压有没有问题。现在设备运维提供的主要功能有监控报警相关的、OTA升级和远程诊断包括日志服务等,功能比较细散,只要有需求就可以去建设。

但是整体总结设备运维的功能的特点有两个,一个是数据化即提供的相关的数据一定是可度量的,不能是模糊的,比如汽车里面油表的状态不是精确的还剩多少升提供三个状态满、不满和空这样用户的心中是没有底的,所以说一定要有精确可度量的数据。第二个是说是可视化的要让用户看到,并且根据不同的可视化诉求提供多种形式比如看速度表方向盘前面低头可以看到仪表盘,装个抬头显示也可以看到。第三个特点是可分析的看到之后会得出一些结论,通常情况下是预知一些风险,产生一些异常的警报比如油不够需要加油,速度过快要减速不然要超速了。

第二个特点是工具化第一部分的数据化帮助看到究竟是什么样的,是否有问题有了问题或者是预知到可能会有问题之后需要一些工具化的东西帮助解决问题,帮助定位整段是否有问题,比如去体检得到一张数据化报告真的出现问题再进行医治。

所以运维的角度和运行时的区别是运行时的部件是不可以少的比如车少了某个部件就无法运行。运维时的部件可以少比如提到的仪表之类的报警功能没有也可以上路但是不会跑那么猛,那么稳,那么快。所以以上介绍了设备与云之间的关系,中间的物联网平台设立的目标是解决衔接之间的问题,有哪些功能模块以及设备运维是怎样的定位和设备运维会做哪些特点的功能,在列的表中有...是还没有将事情做完,是根据业务的需求进行发展的。

image.png


二、实时监控大盘

上面讲解了设备运维的定位,接下来讲解监控报警,主要介绍监控报警的产品架构比较简单,左边是客户业务设备通过物联网平台连接上云之后在云上开展的业务。

在运维台方面提供了几个监控报警能力,一个是有自定义的监控大盘可视化能力以及可以配置对应的报警规则,在控制台上一些产品会透出相关的指标,这是物联网平台的数据被采集之后,底层有IoT数据平台,有强大的数据计算分析能力和阿里云统一的云监控平台,这是阿里云监控报警相关的产品。报警通知渠道目前有钉钉、邮件、短信、电话是按照成本进行排序的。

1、IoT设备实时可视化监控——整体介绍

接下来进入本节课的正题可能会比较枯燥,内容可以在官网的文档中查询到。第一个是针对数据可视化提供的产品功能叫做自定义的监控大函,做过相关技术的对下面的图表不会陌生可能在很多地方都看到过,图表是为了展示业务跑在物联网平台上是怎样的情况就和仪表一样,仪表可以按照需求进行定制。定制包括数据的内容、数据值的参数或者是图标的位置都可以定制,按照数据指标的内容来看目前分为以下几类一个是与设备连接相关的设备的激活数、在线数、上下线次数等,消息上下行的消息量和不同协议的消息量是怎样的等,还有是和数据流转规则引擎相关的流转的不同的云产品大概是怎样的量以及物模型的属性设置、服务调用、事件上报的次数等等,物模型是后期会重点突破的因为目前的监控指标还是局限于物模型基础的指标还没有让业务定义到物模型中去,比如自己建的物模型要关注某一个属性的指标情况,后面会进行这方面的高级支持。

数据图表的类型目前有曲线图还带面积像微积分一样,看曲线就可以,曲线图是反映比较连续的指标变化。还有一类是排行榜是通过IoT的数据平台帮助得到的业务比较关注的数据指标的排行情况,里面有IoT数据执行实例有非常丰富的数据分析计算方面的能力。

image.png

2、IoT设备实时可视化监控——指标图表管理和布局

上面是看到的整体的功能,接下来简单介绍每个图表如何定制如何添加如何定制位置,添加点击添加入口里面会列出可供选择的指标,可以看到有曲线类的和排行榜类的,中间部分有一个数据性的tid打在右上角还加了一把锁说明是需要花钱的,这是数据型实例里面独享的指标,如果升级了相关的数据型能力就可以支持,但是最基础的指标都是免费开放的。

进入添加入口里面是多选,讲解一下操作的细节选完之后点击确定就会加到整体的大盘列表里面,大盘列表最多支持50个图表,同一个指标可以多次添加到图表中因为每个指标是有不同的参数可供定制的,所以同个指标也可以定制不同的参数展示在两个不同的位置。加好图表之后接下来是调整指标图表的布局,里面有四个图表是平台内置默认的是不允许删除的,但是位置可以改变。

像带有删除标和开关按钮的这一类是用户添加进来的,是可以进行删除的也可以暂时隐藏不需要删除,通过鼠标可以上下拖拽调整相对位置。目前是每行有3个图表最多可以放50个所以是很够用的。

image.png

3、IoT设备实时可视化监控——指标参数定制

之前讲到一个指标可以添加多个图表,里面可以定制的参数有第一个聚合参数的选择,聚合函数对应的是同一个指标有差异不同的聚合函数输出了不同的指标,具体的值可以按序选择比如最小、最大、平均,不同指标支持的聚合类型可能不一样,需要根据具体选中的指标来看。第二个是指标维度下钻的设置,比如默认的指标都是到实例里面的有些实例可能有产品的维度,默认所有的产品指标都是聚合在一起的。如果只想关注某一个产品下钻之后的情况关注产品就可以。

当然维度的定义每个指标是不同的可能没有产品维度有一些其他的维度。下一个是设置聚合力度,是指标进行时间聚合的时间的粒度,目前只有1分钟和5分钟两种选择,默认是1分钟。接下来是阈值不是做报警只是用来做参考线,相当于在可视化看到时进行参考,效果相当于在曲线图表中的红线示例的阈值参考线,不会真正的触发报警是可视化来看一下。

针对图表可视化如何添加一个图表、调整布局以及定义的图表展示的相关参数就讲到这里。

image.png

4、IoT设备设备报警配置管理——报警规则配置

接下来讲解如何设置监控报警,监控报警的设置很简单,大致分为两个要素,一个是监控报警的条件与指标的关系。

首先要选择对应的数据指标与之前的可视化是一致的,可能像排行榜之类的不支持监控报警里面就无法选择,但如果有一个图表,图表的右上方有一个菜单可以快捷的创建监控报警,跳转过来会自动将一些已经设置过的指标属性填充。

第二个是填充规则名称,规则名称是设置监控报警非常规则的语义,比如要设一个报警业务暴涨10倍之后会进行关注。接下来是统计字段和指标图表输出字段是类似的,因为有一些数据指标有多个输出字段,需要确认使用哪个字段进行报警。

运算符主要计算除了基础的运算符,还可以支持像昨天上周同一时间百分比的变化以及环比上个探测周期的百分比变化。

阈值根据上面的条件按需设置。执行周期像在图表中执行一个字段会构成一个表达式可以产生一个真值或者假值,持续周期是连续判断几次才会触发报警,可以按需设置如果触发一次报警设为1就可以。

最下面是数据聚合周期数据指标与可视化类似,数据产生的聚合力度如何。

image.png

5、IoT设备报警配置管理——报警通知配置

上面讲解了监控报警触发产生的条件和指标内容相关,接下来讲解报警通知相关的配置。

首先是报警生效的时段是按每一天来的比如睡觉的时候不想有报警可以将晚上排除掉,报警的沉默周期有一点和闹钟一样,几分钟响了之后按了就不会再去响过了十分钟再提醒是类似的意思,下面是报警通知的对象可以看到是以联系人组的形式体现的,联系人组是云监控提供的概念,云监控是阿里云通用统一的基础的云产品,用其他的阿里云产品可能也会用到,联系人组可以理解为通讯录只是不像联系人组里面可以理解为一个人有很多马甲是虚拟的,之前如果没有配置过可以点击链接跳转过去配置联系人,每个对应渠道通知的账号比如电话、邮箱、绑定的钉钉的邮箱的地址,有了联系人组就可以选中需要通知的联系人组,选中之后最后一步是报警级别,报警级别对应的是用什么方式通知到上面配置的联系人,可以看到基本是四组钉钉机器人、短信、电话,需要注意的是短信和电话由于涉及到运营商是需要收费的,里面有免费额度用完之后需要自己购买,这是云监控产品控制的可以参考因监控产品定价说明。 

image.png


三、监控报警管理规则

之前看到第一部分是可视化的监控报表,接着是报警规则,讲解了如何创建报警规则,接下来讲解创建报警规则之后进行查询管理,可以编辑调整实例,也可以将不需要的报警删除。

相关实践学习
基于云监控实现的监控系统
通过阿里云云监控功能给非阿里云主机安装监控插件,从而实现对非阿里云主机的各项指标进行监控和管理,在配置报警规则和报警人的情况下,能对特定的场景做出报警反应通知到报警人的手机上。
相关文章
|
传感器 监控 数据可视化
手把手教你用IoT设备监控家庭环境数据
本实验带您体验如何通过六合一传感器(温度、湿度、二氧化碳、PM2.5、PM10、甲醛)实现家庭环境数据实时采集,并搭建可视化大屏实时监控。
|
存储 人工智能 监控
IoT设备物模型接入价值与实践(一)|学习笔记
快速学习IoT设备物模型接入价值与实践(一)
IoT设备物模型接入价值与实践(一)|学习笔记
|
机器学习/深度学习 运维 监控
阿里云 LOT 设备运维——监控报警介绍|学习笔记
快速学习阿里云 LOT 设备运维——监控报警介绍。
1124 0
阿里云 LOT 设备运维——监控报警介绍|学习笔记
|
存储 监控 安全
网络视频监控如何入门?如何安装和配置、设备选择和实时监控?
网络视频监控如何入门?如何安装和配置、设备选择和实时监控?
884 0
|
消息中间件 监控 物联网
阿里云iot物联网平台监控设备 在线离线状态 解决方案
阿里云iot物联网平台监控设备 在线离线状态 解决方案
1896 0
阿里云iot物联网平台监控设备 在线离线状态 解决方案
|
运维 监控 算法
阿里云IoT设备运维基础——监控报警介绍(二)|学习笔记
快速学习阿里云IoT设备运维基础——监控报警介绍(二)
阿里云IoT设备运维基础——监控报警介绍(二)|学习笔记
|
安全 网络协议 物联网
IoT设备接入基础(三)|学习笔记
IoT设备接入基础(三)|学习笔记
IoT设备接入基础(三)|学习笔记
|
传感器 消息中间件 弹性计算
IoT设备接入基础(一)|学习笔记
快速学习IoT设备接入基础(一)
IoT设备接入基础(一)|学习笔记
|
存储 网络协议 安全
IoT设备接入基础(四)|学习笔记
IoT设备接入基础(四)|学习笔记
IoT设备接入基础(四)|学习笔记
|
安全 物联网 API
IoT设备接入基础(二)|学习笔记
IoT设备接入基础(二)|学习笔记
IoT设备接入基础(二)|学习笔记