开发者社区> 德施> 正文
阿里云
为了无法计算的价值
打开APP
阿里云APP内打开

一站式数据采集存储的利器:阿里云InfluxDB®️数据采集服务

简介: 阿里云InfluxDB®除了提供稳定可靠的时序数据库服务,还提供了非常便捷的数据采集服务。用户能够方便查看各个采集源的运行状态并管理它们,采集的数据会自动存储到阿里云InfluxDB®。用户无需担心运维的问题,实现数据从采集到分析的一站式服务。
+关注继续查看

背景

随着时序数据的飞速增长,时序数据库不仅需要解决系统的稳定性和性能问题,还需实现数据从采集到分析的链路打通,才能让时序数据真正产生价值。在时序数据采集领域,一直缺少自动化的采集工具。虽然用户可以使用一些开源的采集工具实现数据采集,例如,Telegraf、Logstash和TCollector等,但是,这些采集工具都需要用户自行搭建并维护其运行的环境,增加了用户的学习成本,大大提高了数据采集的门槛。另一方面,现有的采集工具缺乏对多个采集源的自动化管理,用户难以统一管理多个不同的采集源,实时监控各个采集工具是否正常运行并采集数据。

阿里云InfluxDB®除了提供稳定可靠的时序数据库服务,还提供了非常便捷的数据采集服务。用户能够方便查看各个采集源的运行状态并管理它们,采集的数据会自动存储到阿里云InfluxDB®。用户无需担心运维的问题,实现数据从采集到分析的一站式服务。本文主要介绍如何使用InfluxDB®的数据采集服务,实现数据从采集到存储的自动化管理。

阿里云InfluxDB®数据采集服务优势

  • 提供丰富的采集指标:支持MySQL、Redis、MongoDB和系统监控等数据的采集
  • 支持监控多个采集源:用户可以一目了然地监控多个采集源的状态
  • 采集源便捷管理:无需编码,用户即可方便地添加、删除和修改采集源
  • 采集数据自动存入InfluxDB®,保障采集数据不丢失

我们能做什么?

1. 轻松采集数据

目前,阿里云InfluxDB®支持采集有关MySQL、Redis、MongoDB和系统监控等四种不同类型的数据,针对每种类型的数据,采集多项监控指标,方便用户更全面地了解被监控对象。用户通过InfluxDB®实例的管理控制台,即可添加新采集源,一键安装,无需编写代码。

采集数据的操作流程如下:

1


  • 创建采集配置:选择采集数据的类型、数据写入的数据库和保留策略。
  • 添加采集源:在数据源机器上一键安装InfluxDB®数据采集工具,选择采集配置,即可开始采集数据。

2. 实时监控采集源

采集源在运行过程中,您可以实时地监控数据采集的状态,查看采集数据最近一次到达InfluxDB®的时间;并且,您还可以随时停止数据的采集,在您认为合适的时候再重新开启数据采集服务。

2

3. 一键切换采集数据类型

如果您想要改变被监控机器上的采集数据类型,无需重新添加新的采集源,只需选择您想要的采集配置即可,数据采集工具会自动切换成采集您指定的监控数据。

4. 采集数据自动存入InfluxDB®

您可以在采集配置中选择数据流入的数据库和保留策略,数据采集工具会自动将采集数据存入指定的数据库和保留策略,并且,您可以在采集源运行的过程中修改数据写入的数据库和保留策略,只需修改采集配置即可。

最佳实践

本小节将介绍如何采集系统监控的数据,并实时展示采集结果。系统监控的数据包含处理器、磁盘、内存、网络、进程和系统等信息,收集的数据分别存储在8个不同的measurement中(measurement分别为cpu、disk、diskio、mem、net、processes、swap和system)。在开始前,请先确保已经成功创建数据库和对该数据库有读写权限的用户账号

1. 创建采集系统监控数据的配置

点击InfluxDB®管理控制台左侧导航栏的“添加采集配置”,进入到采集配置添加界面,如下图所示。填写“采集配置名称”,选择“采集数据类型”为“系统监控”,然后选择“授权账号”、“数据写入DB”和“数据库存储策略”,并填写“授权密码”。点击“添加”即可成功创建采集配置。

3

2. 添加采集源

点击InfluxDB®管理控制台左侧导航栏的“添加采集源”,进入到采集源添加页面。
(1)选择网络类型,“公网”或者“专有网络”,然后点击“下一步”,如下图所示。

4

(2)在数据源所在主机安装采集工具。将安装命令复制到主机上即可运行采集工具。采集工具运行后会与InfluxDB®建立连接,在“新采集源扫描结果列表”上可以看到新添加的采集源,如果在该列表上没有显示,可以点击“刷新”或“自动刷新”。如下图所示。

5

(3)选择采集系统监控的数据。在上图中,点击“选择采集配置”,进入如下界面,从下拉框中选择刚刚创建的名为“collect-system”的采集配置。选择完成后,点击“保存”。

6

(4)启动数据采集。勾选需要启动的采集源,然后点击“完成并启动采集”,采集工具即可在采集源上开始采集数据,如下图所示。

7

3. 查看数据采集的状态

在“采集源列表”中,您可以看到所有与InfluxDB®实例建立连接的采集源,如下图所示。每个采集源由uuid唯一标识,“采集状态”为“running”表示采集工具正在采集数据并上报到InfluxDB®,“最新采集上报成功时间”表示采集数据最近一次成功发送到InfluxDB®的时间。

8

4. 使用Grafana可视化采集数据

(1)安装Grafana。有关如何安装Grafana可查看文档

(2)添加数据源。设置“URL”为InfluxDB®实例的地址,并且填写采集数据所写入的数据库和用户账号,如下图所示。

9

(3)配置Dashboard,编写查询规则。这里示范的是查询磁盘使用率,查询语句为:

SELECT MEAN("used_percent") FROM "disk" GROUP BY time(10s)

实时查询结果如下图所示。

9

您可以根据实际需要,查看其它measurement和field的数据,分别在FROM和SELECT语句中指定即可。

总结

阿里云InfluxDB®提供方便快捷的数据采集服务,自动化管理数据源,帮您解决数据采集的问题,实现数据从采集到存储的自动化。未来,我们会支持更多数据类型和指标的采集,敬请期待。

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
项目4---罗列并解释阿里云服务的存储产品
项目4---罗列并解释阿里云服务的存储产品
173 0
OceanBase时序数据库CeresDB正式商用 为用户提供安全可靠的数据存储管理服务
6月1日,在数据库OceanBase3.0峰会上,OceanBase CEO杨冰宣布首个时序数据库产品CeresDB正式商用。该数据库将为用户提供安全可靠的数据查询和存储管理服务,解决监控运维、物联网等场景中,时间序列数据的高吞吐、横向扩展等难题。
259 0
阿里云云原生数据湖分析DLA重磅发布-数据湖管理,助力企业一站式管理OSS数据湖存储数据
数据湖当前在国内外是比较热的方案,MarketsandMarkets市场调研显示预计数据湖市场规模在2024年会从2019年的79亿美金增长到201亿美金。一些企业已经构建了自己的云原生数据湖方案,有效解决了业务痛点;还有很多企业在构建或者计划构建自己的数据湖。阿里云数据湖分析服务DLA的数据湖管理功能定位为帮助用户构建统一、安全、高效、开放的数据湖解决方案。
3724 0
数据库必知词汇:分布式拒绝服务攻击(DDoS)
分布式拒绝服务攻击(Distributed Denial of Service Attack, DDoS) 是指处于不同位置的多个攻击者同时向一个或数个目标发动攻击,或者一个攻击者控制了位于不同位置的多台机器并利用这些机器对受害者同时实施攻击。由于攻击的发出点是分布在不同地方的,这类攻击称为分布式拒绝服务攻击,其中的攻击者可以有多个。
309 0
分布式关系型数据库服务 DRDS 优化分析型只读实例基于 CBO 进行 JOIN 重排及物理执行策略
信息摘要: DRDS 分析型只读实例优化基于 CBO 进行 Join 重排以及全表扫描增加并行加速能力,同时修复20余项内核问题适用客户: 数据库使用者 / 分布式数据库使用者 / 分库分表 / 开发者 / 互联网企业 / 金融保险行业 / 新零售行业版本/规格功能: 新功能 优化分析型只读实例...
713 0
ITDSD- 4.分布式软件的定量分析
这是关于分布式架构新手入门的第五篇文章。这一篇文章主要介绍通过计算分布式系统中的单次请求成功率,以及重复请求的稳定率获得系统的稳定性估值。依据软件结构评估性能及其冗余。通过对系统的分析判断出潜在的性能瓶颈。
1038 0
释放技术红利 阿里云存储服务降价15%
本文讲的是释放技术红利 阿里云存储服务降价15%【IT168资讯】云计算已经到了落地实施的关键阶段,而且很多企业已经感受到了云计算的价值。尤其是一些初创期的企业,将IT运维服务直接交给云平台,极大地降低了成本。
1749 0
传统应用层逻辑分库DB迁移阿里云DRDS+RDS分布式数据库
随着互联网快速发展,我们的结构化关系数据库在高并发、海量数据的情况下面临单机扩展性问题,首先是单机数据库容量瓶颈,单机数据库在业务高速增长的情况下依赖硬件升级也会到达天花板,并且使用成本变得非常高,而且扩展性的复杂性也是比较高,传统数据库扩容往往意味着服务中断,很难做到业务无感知或者少感知。
11075 0
jdbc_分页查询,大数据,批处理,存储过程
分页查询 实际上就是每次查询一部分记录,并显示: select * from table_name limit StartIndex, PageSize;——>StartIndex:从第几个记录开始查。
796 0
+关注
德施
阿里云InfluxDB & Prometheus技术专家
2
文章
0
问答
来源圈子
更多
相关文档: 时序数据库 TSDB 版
文章排行榜
最热
最新
相关电子书
更多
低代码开发师(初级)实战教程
立即下载
阿里巴巴DevOps 最佳实践手册
立即下载
冬季实战营第三期:MySQL数据库进阶实战
立即下载