快!5分钟快速完成监控系统搭建之实践篇

本文涉及的产品
可观测可视化 Grafana 版,10个用户账号 1个月
简介: 监控告警系统是每一家企业都需要的系统。系统的监控运维告警可以帮助企业快速发现系统故障,定位故障和处理故障,对企业业务稳定性起到至关重要的作用。业务监控系统可以实时进行业务告警,进行业务趋势的分析和判断,对于数据化运营起到重要的帮助。

image.png

前言

监控告警系统是每一家企业都需要的系统。系统的监控运维告警可以帮助企业快速发现系统故障,定位故障和处理故障,对企业业务稳定性起到至关重要的作用。业务监控系统可以实时进行业务告警,进行业务趋势的分析和判断,对于数据化运营起到重要的帮助。

阿里云InfluxDB 提供了一整套快速搭建监控系统的组件和功能,可以帮助企业快速搭建监控系统。2019年8月商业化以来,依靠稳定可靠的服务能力和免运维等特性,在监控领域受到很多用户关注,近期更是进行了重磅升级,集成了Grafana可视化服务。

正文内容

本文将以Linux系统指标监控为例,展示如何基于阿里云InfluxDB®服务快速搭建一个监控系统。这里假设用户已经购买了阿里云InfluxDB®实例,并且创建了名为telegraf的数据库以及管理员账号admin(也可以使用对该库有读写权限的非管理员账号)。如果您还没有开启阿里云InfluxDB®服务,可以戳这里购买,数据库和账号如何创建请参考阿里云文档

基于阿里云InfluxDB搭建监控系统可以分为二个简单的步骤即可完成。
1 配置数据源
2 配置Grafana 仪表盘

接下来,我们就开始基于这两个步骤快速实践一下。 出于展示目的,本文使用的操作系统为CentOS 7,yum作为包管理工具,Ubuntu/Debian用户可以用dpkg等工具完成类似操作。接下来我们实际操作一下。

配置数据采集

主机的系统监控需要安装telegraf作为agent进行指标采集。telegraf是开源的指标采集工具,内用占用小,安装部署简便,下面几部就可以完成。如果有多台主机需要监控,在每台主机上执行下面的步骤即可,在最后的监控仪表盘总可以使用下来列表来选择主机信息。

Step 1: 安装telegraf

这里使用的是当前的最新稳定版本telegraf 1.12.4:

yum install -y https://dl.influxdata.com/telegraf/releases/telegraf-1.12.4-1.x86_64.rpm

 

Step 2: 配置telegraf

Telegraf配置文件的路径为/etc/telegraf/telegraf.conf,使用文本编辑器(比如vim)对这个文件进行编辑,配置内容如下:

# 采集插件
[[inputs.cpu]]  
  percpu = true
  totalcpu = true
  collect_cpu_time = false

[[inputs.disk]]
  mount_points = ["/"]
  ignore_fs = ["tmpfs", "devtmpfs"]

[[inputs.diskio]]
  devices = ["vda"] # 这里配置需要采集的磁盘设备

[[inputs.kernel]]

[[inputs.mem]]

[[inputs.processes]]

[[inputs.swap]]

[[inputs.system]]

[[inputs.net]]
  interfaces = ["eth0"]

[[inputs.netstat]]

# influxdb 配置
[[outputs.influxdb]]
  urls = ["https://ts-xxxxxxxxxx.influxdata.rds.aliyuncs.com:3242"] # influxdb实例的公网访问地址 
  database = "telegraf"
  username = "admin"
  password = "yourpassword"

注意在[[outputs.influxdb]]部分设置阿里云InfluxDB®实例的访问地址,数据写入的数据库名,以及访问数据库的账号信息。

Step 3: 启动telegraf

配置文件编辑保存好,使用下面的命令启动telegraf服务,主机指标数据就可以写入到InfluxDB®中了

systemctl start telegraf.service

配置Grafana

Grafana是流行的开源时序分析平台,采用go语言编写,当前活跃安装数高达40万,可以说是监控场景的标配组件了。Grafana支持多种流行的数据源,比如InfluxDB、Prometheus、OpentTSDB、Graphite等;可视化方面Grafana提供了酷炫的图表,用户可以动态创建仪表盘(dashboard),支持模板变量作为下拉列表;数据探索(Explore)页面允许用户使用ad-hoc查询在数据源上进行数据分析,并且提供了语句自动补全等贴心功能;支持邮件、webhook等多种报警通道,用户可以自定义报警规则。
阿里云将Grafana监控可视化与InfluxDB®的存储分析能力无缝对接,让用户无需部署和运维就可以在快速搭建一个监控系统,并且不需要支付额外费用。

Step 4: 配置Grafana数据源源

要使用Grafana,需要配置与InfluxDB®数据库相关联的数据源,我们在telegraf库上创建一个名为my-datasource的数据源,具体步骤参考文档,这里不重复了。

Step 5: 创建仪表盘

用户可以使用查询语句创建仪表盘,为每个panel定义查询语句和展示方式;实际上多数场景下不需要这么麻烦,因为官方社区中有很多优秀的仪表盘模板(https://grafana.com/grafana/dashboards),可以很好的满足需求。
比如我们要配置的Linux主机监控,可以直接使用Linux System Overview  这个仪表盘:

image.png

而我们要做的只是记住2381这个dashboard ID。

从阿里云InfluxDB®控制台打开Grafana访问地址,登录之后即可进入仪表盘管理界面:

image.png

在仪表盘管理界面,点击Import按钮进入Import页面,输入这个ID即可:

image.png




输入ID后,Grafana会自动识别,进入选项页面,进行数据源的配置,这里我们选择之前创建好的数据源 my-datasource
image.png


然后点击Import,仪表盘就创建好了!

image.png

总结

本文展示了如何基于阿里云InfluxDB®服务快速搭建一个主机监控系统,指标数据通过telegraf进行采集,数据写入到InfluxDB®进行存储,Grafana作为前端进行可视化展示,用户也可以根据自己的需求在Grafana配置报警。阿里云InfluxDB®提供的Grafana服务为用户降低了运维和硬件成本,与InfluxDB的存储分析能力相得益彰,为监控领域的用户提供了一个绝佳的选择。

更新: 近期阿里云InfluxDB®推出了一元购优惠活动,新用户可以首月一元体验,规格选择4c16g即可:

image

参考文档

相关实践学习
通过可观测可视化Grafana版进行数据可视化展示与分析
使用可观测可视化Grafana版进行数据可视化展示与分析。
目录
相关文章
|
7月前
|
XML Prometheus 运维
自动化监控有哪些开源系统
自动化监控有哪些开源系统
132 1
|
运维 监控 安全
深入了解WGCLOUD - 开源运维监测平台
WGCLOUD是一款轻量高效的运维监测系统**,开源免费,性能高效,稳定安全,开箱即用,部署实施操作简单,它可以让任何角色快速上手使用,比如我们的开发工程师,产品工程师,项目经理,运维工程师,数据库工程师等
深入了解WGCLOUD - 开源运维监测平台
|
Prometheus 运维 监控
无监控,不运维!深入浅出介绍ChengYing监控设计和使用
监控系统俗称「第三只眼」,几乎是我们每天都会打交道的系统,它也一直是IT系统中的核心组成部分,负责问题的发现以及辅助性的定位。 ChengYing作为一站式全自动化全生命周期大数据平台运维管家,自然也提供大数据产品的监控服务。这篇文章,将为大家系统性地介绍ChengYing监控的设计和使用,带大家进一步了解ChengYing。
302 0
无监控,不运维!深入浅出介绍ChengYing监控设计和使用
|
运维 Prometheus 监控
【滴滴开源运维监控系统】夜莺V5版本部署实践
【滴滴开源运维监控系统】夜莺V5版本部署实践
1117 0
【滴滴开源运维监控系统】夜莺V5版本部署实践
|
运维 数据可视化 架构师
《可视化架构运维实践》下载
阿里云空中架构师云速搭 CADT 为上云应用提供可视化自助式云架构管理,显著降低应用云上管理的难度和时间成本。
161 0
《可视化架构运维实践》下载
|
存储 监控 数据可视化
ELK分布式日志实时监控系统搭建实录(避坑指南)
文本主要记录ELK搭建过程的主要步骤,使用组件:filebeat+logstash+elasticsearch+kibana。filebeat收集日志给到logstash(logstash也可以单独干这个活)elasticsearch可以说是个索引数据库也可以认为是搜索引擎,他主要负责数据的存储,这里就是日志信息了,kibana则是一个可视化的elasticsearch的操作工具。
432 0
|
SQL 存储 数据采集
5分钟完成业务实时监控系统搭建,是一种什么样的体验?
道旅需要构建一个全面的指标监控系统,既包括系统的业务指标:如各类业务类型的请求数变化,不同供应商信息的变化,客户请求的明细大盘,各酒店请求量的排名变化,不同城市的订单转换率分析报表等;也包括系统的运行指标:如服务器请求响应时间, 带宽使用情况等。评估了市场上的监控产品之后,道旅选择了阿里云应用实时监控服务 ARMS。
3123 8
5分钟完成业务实时监控系统搭建,是一种什么样的体验?
|
监控 BI
从0到1,搭建数据监控体系
大家好,我是爱学习的小熊妹。 上周五,阳光很好,微风很好,无惊无险又到六点,小xiong熊妹美美地在座位上补了个妆,拿起小包包,正打算去撸麻辣火锅的时候,听到了最怕听到的话—— 小熊妹,麻烦给个数,领导马上就要看…… 我整个人顿时就不好了!我的火锅,我的小伙伴,我的奶茶,我的电影!
430 0
从0到1,搭建数据监控体系
|
Prometheus 监控 Cloud Native
从零开始搭建ELK+GPE监控预警系统
前言 本文可能不会详细记录每一步实现的过程,但一定程度上可以引领小伙伴走向更开阔的视野,串联每个环节,呈现予你不一样的效果。 业务规模 8个平台 100+台服务器 10+个集群分组 微服务600+ 用户N+ 面临问题 随着分布式微服务容器技术的发展,传统监控系统面临许多问题: 容器如何监控 微服务如何监控 集群性能如何进行分析计算 如何管理agent端大量配置脚本 这些都是传统监控所要面临的棘手问题,那么如何解决当前遇到的问题,GPE横空出世,后面会重点分析。
122738 0

热门文章

最新文章