「DataFlux」基于行协议实现软件自监控

简介:

在 DataFlux 的日常开发中,我们也会遇到其他开发者都会遇到的问题:怎么监控我们⾃己写的程序呢?

DataFlux ⼤概的模块如下:

image

在上图中,各种数据都是通过数据网关(DataWay)传入数据中心的,数据网关中收集的都是行协议形式的数据,所谓行协议,它大概形式如下:

指标集名称 标签列列表 指标列列表 时间戳 

比如:

其中,标签列表是相对固定的属性,如体检数据中的姓名和性别。而指标列表则是⼀些相对比较动态的属性,它们会随着时间推移而变化。最后就是以纳秒为单位的 Unix 时间戳。

在上图中,为了采集 k8s 集群内各个服务的指标数据,有两种⽅方式:

  • 开发专⽤的采集器,采集各个服务的数据,然后上报给数据网关
  • 各个服务⾃己报告⾃己感兴趣的指标,上报给数据⽹关
    image

第⼀种方式实现不太方便,首先,各个服务需要开放数据采集接口,然后还要单独开发采集器调用接口来采集运行⽇志,通常情况下,这些数据都是⾼度定制的,不太能使用现有的工具来采集。

第二种⽅式就很灵活,得益于行协议的简单设计,各个子服务只需要将⾃己感兴趣的运行指标,以行协议的方式上报给数据⽹关即可,⽆无需在采用其它的⼯具来收集运⾏⽇志。

下⾯是⼀段示例代码:查询 InfluxDB 时,我们希望能监控一些较慢(响应时间大于 1 秒)的查询:

start := time.Now()
sql := `SELECT * FROM "体检数据"` influx.Query(sql)
elapsed := time.Since(start)
if elapsed.Seconds() > 1.0 {
event := fmt.Sprintf(`influx_slow_query,集群ID=%s,DB=%s sql="%s",cost=%f %d`, influx.InstanceID,
                          influx.DB,
                          sql,
                          elapsed.Seconds(),
                          time.Now().Nanosecond())
     dataway.Send(event)
 }

这样一来,一旦有一个慢查询,就能在 Web 上看到这个慢查询记录,我们可以轻松定位是哪个查询语句、 在哪个实例上出现了慢查询。进一步通过对 SQL 以及 InfluxDB 本身的监控分析,我们就能确定,是 SQL 编写的问题(这里明显是因为没有 LIMIT 数据条数,数据量太大导致的),还是集群负载过高的问题。

通过这种⽅式,我们能收集数据中心、数据网关自身以及集群内其它子服务的运行日志(如上图中红线箭头所示),甚至,通过 Telegraf、Prometheus 等开源⼯具,我们还能将 k8s 集群本身的数据,通过数据网关汇聚,从而实现对它们的统一监控。
image

相关文章
|
4月前
|
移动开发 JSON 监控
网络协议解析:在员工上网监控软件中实现HTTP流量分析
随着企业对员工网络活动的监控需求不断增加,开发一套能够实现HTTP流量分析的网络协议解析系统变得愈发重要。本文将深入探讨如何在员工上网监控软件中实现HTTP流量分析,通过代码示例演示关键步骤。
225 0
|
24天前
|
存储 网络安全 虚拟化
window server2016 ISCSI存储程序对接华三CAS平台
该文档介绍了使用VMware 17 Pro搭建Windows Server 2016 64位的过程,并结合华三CAS平台设置ISCSI存储服务。首先,通过快速安装创建虚拟机,选择桌面版本。安装完成后,开启服务器管理器,拍摄快照备份。接着,添加1TB硬盘,格式化后,在服务器管理器中安装ISCSI角色和功能。配置ISCSI发起器,指定IP地址,并在CAS平台注册存储设备。最后,共享存储并格式化LUN,完成实验配置。
28 0
window server2016 ISCSI存储程序对接华三CAS平台
|
4月前
|
运维 应用服务中间件 网络安全
利于群晖的File Station+SFTP实现第三方人员快速获取服务器应用日志
利于群晖的File Station+SFTP实现第三方人员快速获取服务器应用日志
92 0
|
8月前
|
安全 Linux 网络安全
嵌入式QT应用程序与WEB端通信遇到的HTTPS校验证书的问题记录
嵌入式QT应用程序与WEB端通信遇到的HTTPS校验证书的问题记录
143 0
|
12月前
|
监控
APM - 零侵入监控Http服务
APM - 零侵入监控Http服务
178 0
|
网络协议 Python
提高LDAP服务安全性和易用性的TCP代理插件
LDAP服务是一种应用层协议,用于提供分布式目录服务,并管理用户、组织、设备等实体的信息。为了提高客户端访问LDAP服务的便捷性和安全性,可以采用TCP代理插件。该插件可在客户端和LDAP服务器之间建立可靠的TCP连接,并根据需要转发或修改数据包。
提高LDAP服务安全性和易用性的TCP代理插件
|
数据采集 API
火车头采集器如何设置http代理数据采集
在我们采集数据过程中,如果遇到对方网站限制了你的ip访问,就可以通过二级代理服务器的功能来实现更换ip。
火车头采集器如何设置http代理数据采集
|
存储 监控 关系型数据库
开源EDR(OSSEC)基础篇- 02 -部署环境与安装方式
上一篇介绍了OSSEC设计的定位以及产品输出的能力,在对OSSEC安全功能有个大体印象的前提下,我们接着开始实践OSSEC的安装和部署,本篇重点的重点是帮助初次接触或者对OSSEC不熟悉的同学,无痛安装,并能够用最短的时间在所服务的企业内部真正的使用起来
6476 0