【数据可观测】阿里云的Grafana云监控大盘服务

本文涉及的产品
可观测可视化 Grafana 版,10个用户账号 1个月
可观测监控 Prometheus 版,每月50GB免费额度
应用实时监控服务-应用监控,每月50GB免费额度
简介: 阿里云发布的grafana托管服务,更是为云上的资产提供了高效的监控数据可观测能力。阿里云grafana弹性、免运维,可以方便的对接云上云下的各种数据源。

在监控系统体系里,grafana相信大家都是听说过的,grafana将我们的监控数据以大屏的形式直观的展示出来,作为一个喜欢折腾linux的我来说,自从grafana开源套件的出现,他的展示直观、配置轻便、功能强大、界面科幻一直是吸引我的地方。当grafana服务运行之后,只需要在web界面中进行配置即可。

阿里云发布的grafana托管服务,更是为云上的资产提供了高效的监控数据可观测能力。阿里云grafana弹性、免运维,可以方便的对接云上云下的各种数据源。

 

 

一、启用创建Grafana服务

grafana服务进行下单,需要填入【工作区名称】与【Admin密码】

阿里云grafana托管服务,可使用的用户可以通过阿里云账户进行单点登录转跳,也可以通过管理员账户admin完成登陆

 

image.png

 

 

 

完成grafana专家版服务的创建

image.png

 

 

点击ID,进入工作区管理界面,此处可以看到grafana的连接信息,这个url就是我们访问grafana的地址,下方提供了云服务集成。

image.png

 

访问连接信息,即可访问grafana的主页

image.png

 

 

二、手动添加数据源,对ECS云服务器进行监控可观测性的实现

我手上刚好有四台ECS资源,这里就对ECS云服务进行一个监控数据展示的配置。对ECS的监控数据源配置有几种,包括【企业云监控】、【Prome云监控探针到ECS】等,这里针对我个人没有那么多云资产的情况,就使用【aliyun-cms数据源插件】完成grafana到云监控数据源的配置。

 

1.手动配置云监控数据源插件

在【Configuraion】下,点击【Data sources】,此处可以手动添加数据源

点击【Add data source

image.png

 

 

阿里grafana提供了多种数据源接入,此处我们选择【CMS Grafana Service】,点击【Select

image.png

 

 

配置【Aliyun UserId】输入用户ID、【AccessKeyId】、【AccessKey】,点击【Save&test】进行保存与测试连接

image.png

 

OK,我们的信息么问题,提示数据源工作了

image.png

 

完成了对云监控数据的手动添加,此时cms显示default默认数据源

image.png

 

 

 

 

2.完成Dashboard展示面板的创建

 

先看一下我的四台ECS在云监控下的情况,所有主机监控正常,插件运行中

image.png

 

grafana上选择【+】,create创建【Dashboard

image.png

 

dashboard页面点击【Add panel】新建面板

image.png

 

这里测试举例几种面板的形式,可能观测的内容和展示的方式不太合适,这个见仁见智咯

Time series时序图】ECSCPU使用率展示

进入面板的新建,这里我们的data source数据源是默认的cms,即为云监控的数据。

Namespace】选择acs_ecs_dashboard,为ECS的相关监控

Metric】选择cpuutilzation,为CPU使用率

Dimensions】选择需要展示的ECS云服务器实例

Y-column】选择Average平均值,当然也有最大值max与最小值min

X-column】默认timestamp

 

右侧为面板的相关配置,这里我修改了【Title】标题,完成配置点击右上角【Apply

image.png

所有需要配置的几项参数,都会自动展开或补全

Namesapce】:监控的云服务

Metric】:监控指标

【Period】:同步周期

【Group】:云监控分组

【Dimensions】:展示实例

 

 

 

这里的Metric】监控指标,可以在云监控的文档中找到参照

监控项说明-指路:https://help.aliyun.com/document_detail/43505.html

image.png

 

面板完成创建可执行修改编辑,导出删除等

image.png

 

 

Gauge仪表盘】ECS的磁盘写入IOPS展示

Metric】选择DiskWriteIOPS,为所有磁盘写IOPS

其他配置参照之前

 

image.png

 

 

Stat状态阈值图】ECS的TCP连接数展示

Metric】选择net_tcpconnection,为TCP连接数

其他配置参照之前

这里我对面板属性【thresholds】进行了配置,对各个阶段的数值区分颜色,可设定固定值也可百分比

 

image.png

 

 

Bar gaugeECS的内存用率展示

Metric】选择memory_usedutilization,为内存使用率

其他配置参照之前

这里我对面板属性【orientation】进行了配置,调整了水平条的方向为纵向

 

image.png

 

 

完成了需要展示的面板配置,这就是整个dashboard的展示效果

当然可以折腾更多监控类型,这里就简单展示几项。

image.png

 

 

与云监控里的主机监控提供了监控相比,是不是更好看了,更高大上了,更直观了,也可以我们自己定义更多的监控项目了!好东西哇

image.png

 

 

 

 

 

 

二、其他数据源的接入(举例)

阿里云的接入不仅仅是云监控,更多应用层面的监控,集群层面的监控。。。grafana支持更多的数据源进行接入。我这里再举例两种不同类型接入方式

image.jpeg

1.通过ARMS下的Prometheus实例

Prometheus是一种多维度的系统监控与报警系统,同时阿里云的ARMS提供了各种颗粒更加细化的应用级别监控。这里我们继续将prome实例接入ECS集群,将prome监控系统作为数据源集成到grafana

 

ARMS的控制台,新建Prometheus实例,选择【for VPC】接入ECS集群

 

image.png

 

选择VPC并配置安装信息

image.png

 

 

完成VPC接入,就可以对不少应用与服务环境进行监控,这里我就不多配置了。

image.png

 

回到grafana的控制台,就可在下方【云服务集成】中的【Prometheus服务】找到接入的VPC,点击同步确认即可

image.png

 

 

完成同步后,grafana界面中数据源出现prome的对接信息

image.png

 

 

同时系统自动创建一个prome的文件夹,可以在这个文件夹下创建相关dashboard,分门别类管理

image.png

 

 

 

2.打通VPC对接自建的数据源

数据源除了对接云服务,也可对接企业自建的监控系统,获取数据源。通过VPC内网获取数据源,可灵活利用原有的监控系统,降低成本,也可以减少来自公网的攻击。这里我假设我的监控系统数据在内网ECSMysql数据库中,对接一下内网的数据库服务。

 

grafana控制台里,选择【VPC数据通道管理】,点击【安装数据源通道】

选择好【区域】,【VPC】,【交换机】,我这里就选择了与ECS云服务器同一VSW。完成点击【安装】

image.png

 

此时回到grafana,点击【DataSource】,选择【MySQL

image.png

 

这里就可以选择刚刚添加的VPC通道,手动配置数据库用户连接信息即可

image.png

 

点击下方【Save & test】保存配置并且测试,这里回显已经完成数据库的连接测试,ok

image.png

 

 

完成数据源的添加,创建面板时就可以选择相对应的数据源

image.png

 

阿里云作为国内可观测的引领者,没有采用完全保姆式闭源的产品去实现,而是采用了对接多种云上\云下,自研\开源的各种方式实现云上的可观测服务落地,对待用户原有的监控方案有不错的兼容。  

 

 

 

 

相关实践学习
基于云监控实现的监控系统
通过阿里云云监控功能给非阿里云主机安装监控插件,从而实现对非阿里云主机的各项指标进行监控和管理,在配置报警规则和报警人的情况下,能对特定的场景做出报警反应通知到报警人的手机上。
相关文章
|
7月前
|
弹性计算 监控 数据安全/隐私保护
阿里云ECS云监控界面
阿里云ECS云监控界面
1029 2
|
7月前
|
机器学习/深度学习 弹性计算 运维
ECS阿里云监控服务
ECS阿里云监控服务
152 3
|
2月前
|
数据采集 弹性计算 监控
为什么云监控、云产品流量监控中的流量数据和DDoS防护的流量监控数据有差异?
为什么云监控、云产品流量监控中的流量数据和DDoS防护的流量监控数据有差异?
为什么云监控、云产品流量监控中的流量数据和DDoS防护的流量监控数据有差异?
|
5月前
|
运维 Kubernetes API
kubevela可观测体系问题之使用kubectl命令查询Grafana Dashboard的问题如何解决
kubevela可观测体系问题之使用kubectl命令查询Grafana Dashboard的问题如何解决
|
6月前
|
Kubernetes Ubuntu Linux
k8s部署grafana beyla实现app应用服务依赖图可观测
k8s部署grafana beyla实现app应用服务依赖图可观测
74 4
|
7月前
|
弹性计算 监控 安全
【阿里云弹性计算】ECS实例监控与告警系统构建:利用阿里云监控服务保障稳定性
【5月更文挑战第23天】在数字化时代,阿里云弹性计算服务(ECS)为业务连续性提供保障。通过阿里云监控服务,用户可实时监控ECS实例的CPU、内存、磁盘I/O和网络流量等指标。启用监控,创建自定义视图集中显示关键指标,并设置告警规则(如CPU使用率超80%),结合多种通知方式确保及时响应。定期维护和优化告警策略,利用健康诊断工具,能提升服务高可用性和稳定性,确保云服务的卓越性能。
261 1
|
存储 Prometheus 监控
服务搭建篇(一) 搭建基于prometheus + node_exporter + grafana + Alertmanager 的监控报警系统 , 保姆级教程
Alertmanager处理客户端应用程序(如Prometheus服务器)发送的警报。它负责重复数据删除、分组,并将它们路由到正确的接收器集成,如电子邮件、PagerDuty或OpsGenie。它还负责静音和抑制警报
335 0
|
7月前
|
Prometheus 数据可视化 Cloud Native
助力工业物联网,工业大数据之服务域:可视化工具Grafana介绍【三十八】
助力工业物联网,工业大数据之服务域:可视化工具Grafana介绍【三十八】
160 1
|
存储 运维 监控
云监控cms与ali promethues 结合 ali grafana 的“百变金刚”灵活观测心得
阿里云的云监控cms与实时应用监控arms众多用户将其理解为竟品,实则不然,两者如以互补的心态使用则会发现另一片天地。 依靠cms与云产品数据强一致性与arms下promethues的超高灵活整合能力,完成想要的观测、告警之运维能力。 本文介绍一下,云监控数据同步在promethues中结合grafana展示,最后达到统一管理大盘集、统一告警平台。 关键词:可预测告警 自定义报警 统一报警 统一观测 前提:开启企业云监控 、开启arms
243 0
|
弹性计算 Prometheus 监控
《2021 阿里云可观测技术峰会演讲实录合辑(下)》——一、基于OPLG从0到1构建统一可观测平台实践——场景实践2:如何基于Prometheus和Grafana做统一的监控和告警
《2021 阿里云可观测技术峰会演讲实录合辑(下)》——一、基于OPLG从0到1构建统一可观测平台实践——场景实践2:如何基于Prometheus和Grafana做统一的监控和告警
261 0

相关产品

  • 可观测可视化 Grafana 版