一站式数据采集存储的利器:阿里云InfluxDB®️数据采集服务

本文涉及的产品
RDS MySQL DuckDB 分析主实例,集群系列 4核8GB
简介: 随着时序数据的飞速增长,时序数据库不仅需要解决系统的稳定性和性能问题,还需实现数据从采集到分析的链路打通,才能让时序数据真正产生价值。

背景

随着时序数据的飞速增长,时序数据库不仅需要解决系统的稳定性和性能问题,还需实现数据从采集到分析的链路打通,才能让时序数据真正产生价值。

在时序数据采集领域,一直缺少自动化的采集工具。虽然用户可以使用一些开源的采集工具实现数据采集,例如,Telegraf、Logstash和TCollector等,但是,这些采集工具都需要用户自行搭建并维护其运行的环境,增加了用户的学习成本,大大提高了数据采集的门槛。另一方面,现有的采集工具缺乏对多个采集源的自动化管理,用户难以统一管理多个不同的采集源,实时监控各个采集工具是否正常运行并采集数据。

阿里云InfluxDB®除了提供稳定可靠的时序数据库服务,还提供了非常便捷的数据采集服务。用户能够方便查看各个采集源的运行状态并管理它们,采集的数据会自动存储到阿里云InfluxDB®。用户无需担心运维的问题,实现数据从采集到分析的一站式服务。本文主要介绍如何使用InfluxDB®的数据采集服务,实现数据从采集到存储的自动化管理。

阿里云InfluxDB®数据采集服务优势

  • 提供丰富的采集指标:支持MySQL、Redis、MongoDB和系统监控等数据的采集
  • 支持监控多个采集源:用户可以一目了然地监控多个采集源的状态
  • 采集源便捷管理:无需编码,用户即可方便地添加、删除和修改采集源
  • 采集数据自动存入InfluxDB®,保障采集数据不丢失

我们能做什么?

1. 轻松采集数据
目前,阿里云InfluxDB®支持采集有关MySQL、Redis、MongoDB和系统监控等四种不同类型的数据,针对每种类型的数据,采集多项监控指标,方便用户更全面地了解被监控对象。用户通过InfluxDB®实例的管理控制台,即可添加新采集源,一键安装,无需编写代码。

采集数据的操作流程如下:

1.png

  • 创建采集配置:选择采集数据的类型、数据写入的数据库和保留策略。
  • 添加采集源:在数据源机器上一键安装InfluxDB®数据采集工具,选择采集配置,即可开始采集数据。

2. 实时监控采集源
采集源在运行过程中,您可以实时地监控数据采集的状态,查看采集数据最近一次到达InfluxDB®的时间;并且,您还可以随时停止数据的采集,在您认为合适的时候再重新开启数据采集服务。

2.png

3. 一键切换采集数据类型
如果您想要改变被监控机器上的采集数据类型,无需重新添加新的采集源,只需选择您想要的采集配置即可,数据采集工具会自动切换成采集您指定的监控数据。

4. 采集数据自动存入InfluxDB®
您可以在采集配置中选择数据流入的数据库和保留策略,数据采集工具会自动将采集数据存入指定的数据库和保留策略,并且,您可以在采集源运行的过程中修改数据写入的数据库和保留策略,只需修改采集配置即可。

最佳实践

本小节将介绍如何采集系统监控的数据,并实时展示采集结果。系统监控的数据包含处理器、磁盘、内存、网络、进程和系统等信息,收集的数据分别存储在8个不同的measurement中(measurement分别为cpu、disk、diskio、mem、net、processes、swap和system)。在开始前,请先确保已经成功创建数据库和对该数据库有读写权限的用户账号。

1. 创建采集系统监控数据的配置
点击InfluxDB®管理控制台左侧导航栏的“添加采集配置”,进入到采集配置添加界面,如下图所示。填写“采集配置名称”,选择“采集数据类型”为“系统监控”,然后选择“授权账号”、“数据写入DB”和“数据库存储策略”,并填写“授权密码”。点击“添加”即可成功创建采集配置。

3.png

2. 添加采集源
点击InfluxDB®管理控制台左侧导航栏的“添加采集源”,进入到采集源添加页面。
(1)选择网络类型,“公网”或者“专有网络”,然后点击“下一步”,如下图所示。

4.png

(2)在数据源所在主机安装采集工具。将安装命令复制到主机上即可运行采集工具。采集工具运行后会与InfluxDB®建立连接,在“新采集源扫描结果列表”上可以看到新添加的采集源,如果在该列表上没有显示,可以点击“刷新”或“自动刷新”。如下图所示。

5.png

(3)选择采集系统监控的数据。在上图中,点击“选择采集配置”,进入如下界面,从下拉框中选择刚刚创建的名为“collect-system”的采集配置。选择完成后,点击“保存”。

6.png

(4)启动数据采集。勾选需要启动的采集源,然后点击“完成并启动采集”,采集工具即可在采集源上开始采集数据,如下图所示。
7.png

3. 查看数据采集的状态
在“采集源列表”中,您可以看到所有与InfluxDB®实例建立连接的采集源,如下图所示。每个采集源由uuid唯一标识,“采集状态”为“running”表示采集工具正在采集数据并上报到InfluxDB®,“最新采集上报成功时间”表示采集数据最近一次成功发送到InfluxDB®的时间。

8.png

4. 使用Grafana可视化采集数据
(1)安装Grafana。有关如何安装Grafana可查看文档

(2)添加数据源。设置“URL”为InfluxDB®实例的地址,并且填写采集数据所写入的数据库和用户账号,如下图所示。

9.png

(3)配置Dashboard,编写查询规则。这里示范的是查询磁盘使用率,查询语句为:

SELECT MEAN("used_percent") FROM "disk" GROUP BY time(10s)

实时查询结果如下图所示。

010.png

您可以根据实际需要,查看其它measurement和field的数据,分别在FROM和SELECT语句中指定即可。

总结

阿里云InfluxDB®提供方便快捷的数据采集服务,自动化管理数据源,帮您解决数据采集的问题,实现数据从采集到存储的自动化。未来,我们会支持更多数据类型和指标的采集,敬请期待。


目录
相关文章
|
1月前
|
虚拟化 UED
VMware Workstation 17.5 安装教程(小白也能看懂)
下载VMware Workstation 17.5安装包,双击运行并同意协议,选择典型安装或自定义路径。可选取消更新提示与体验计划,设置快捷方式后点击安装。安装完成后重启(如提示),首次启动可输入序列号或试用,即可创建虚拟机使用。
|
4月前
|
存储 分布式计算 Linux
安装篇--CentOS 7 虚拟机安装
VMware 装 CentOS 7 不知道从哪下手?这篇超详细图文教程手把手教你在 VMware Workstation 中完成 CentOS 7 桌面系统的完整安装流程。从 ISO 镜像下载、虚拟机配置,到安装图形界面、设置用户密码,每一步都有截图讲解,适合零基础新手快速上手。装好之后无论你是要搭 Hadoop 集群,还是练 Linux ,这个环境都够你折腾一整天!
1800 3
|
SQL 数据采集 关系型数据库
大数据采集和抽取怎么做?这篇文章终于说明白了!
数据是数据中台\数据平台核心中的核心,因此数据汇聚必然是数据中台/平台的入口,本文详细讲述采集模块的方方面面、采集框架的使用选型以及企业真实落地
大数据采集和抽取怎么做?这篇文章终于说明白了!
|
Ubuntu 网络协议 Linux
【附安装包】CentOS7(Linux)详细安装教程(手把手图文详解版)
【附安装包】CentOS7(Linux)详细安装教程(手把手图文详解版)
6411 2
|
安全 异构计算
为大型语言模型 (LLM) 提供服务需要多少 GPU 内存?
为大型语言模型 (LLM) 提供服务需要多少 GPU 内存?
1152 0
为大型语言模型 (LLM) 提供服务需要多少 GPU 内存?
|
SQL 关系型数据库 MySQL
实时计算 Flink版产品使用问题之如何进行MySQL到MySQL的动态同步
实时计算Flink版作为一种强大的流处理和批处理统一的计算框架,广泛应用于各种需要实时数据处理和分析的场景。实时计算Flink版通常结合SQL接口、DataStream API、以及与上下游数据源和存储系统的丰富连接器,提供了一套全面的解决方案,以应对各种实时计算需求。其低延迟、高吞吐、容错性强的特点,使其成为众多企业和组织实时数据处理首选的技术平台。以下是实时计算Flink版的一些典型使用合集。
|
缓存 监控 前端开发
大量数据如何做分页处理
【8月更文挑战第13天】面对大量数据分页,可从数据库与应用两方面着手:数据库端利用内置分页功能如MySQL的`LIMIT`与`OFFSET`,及SQL Server的`ROW_NUMBER()`;优化查询,精选字段并为常用排序字段加索引。应用端采用缓存已分页数据、异步加载新页及前端懒加载技术。同时限制最大页数并持续监控优化性能,确保高效查询与良好用户体验。
550 0
|
消息中间件 SQL 运维
如何设计实时数据平台(技术篇)
本文从技术角度入手,介绍RTDP的技术选型和相关组件,探讨适用不同应用场景的相关模式。
|
Java 微服务 Spring
了解Sidecar模式
本文介绍Sidecar模式的特点,及其应用的场景。熟悉Native Cloud或者微服务的童鞋应该知道,在云环境下,技术栈可以是多种多样的。那么如何能够将这些异构的服务组件串联起来,成为了服务治理的一个重大课题。
5479 0
|
消息中间件 Java Kafka
kakfa 常见错误(长期更新)
kakfa 常见错误(长期更新)
1132 1