深入解读面向微服务的分布式秒级监控系统Infinsight

简介: 背景 在云服务环境中,服务的质量一向是云服务厂商关注的重点,为了最大的保证云服务质量,以及在出现故障时能够协助用户对故障进行快速的定位,监控服务在其中起着非常重要的作用。 目前,许多云厂商提供的监控服务多在分钟级,这种级别的监控服务对于瞬息万变的服务变化,往往粒度过大了。

背景

在云服务环境中,服务的质量一向是云服务厂商关注的重点,为了最大的保证云服务质量,以及在出现故障时能够协助用户对故障进行快速的定位,监控服务在其中起着非常重要的作用。

目前,许多云厂商提供的监控服务多在分钟级,这种级别的监控服务对于瞬息万变的服务变化,往往粒度过大了。尤其是针对某些瞬间的资源抖动,以及短暂的慢查询,分钟级的监控数据往往无法发现这些细微的问题,很多隐患也就此淹没掉。

因此,针对以上场景,拥有一套具备细粒度、实时监控能力的监控系统,就变得迫在眉睫。

简介

Infinsight是一个使用golang语言编写的面向微服务,提供秒级监控能力的分布式监控服务,借助MongoDB进行配置管理和数据持久化,以及借助Grafana进行可视化展示,为用户提供从采集、存储到展示的完整的监控平台。

Infinsight目前服务于MongoDB和Redis云数据库,为数以万计的用户服务提供全面且准实时的监控服务。Infinshgit对MongoDB和Redis服务每秒近千项指标进行实时采集,并对数据进行压缩存储,数据压缩比基于线上统计:MongoDB(32:1)、Redis Proxy(80:1),这使得我们仅用了不到30TB的存储容量,确保了7*30天数万亿的全量秒级数据留存,以方便追查历史问题,以及进行各种数据分析。

并且,Infinsight的开源版本已经在github上发布,除削减了和内部系统的耦合功能以外,完整的保留了Infinsight的全部功能。

应用场景举例

Infinsight是面向微服务的监控系统,是一个无agent系统,所以需要服务自身具备服务状态查询能力。

目前Infinsight可以提供:mysql、redis、mongodb三款常用数据库的监控能力。并且,在数据库监控能力之外,还提供了http+json的通用监控能力。

用户只需要配置好所需的服务类型和需要监控的服务的IP:PORT,Infinsight便会自动抓取服务的全部state信息,并提供默认的展示模版,用户几乎不需要太多的配置即可快速搭建专业的监控服务平台。

正是基于Infinsight灵活高效的部署能力,用户除了可以基于Infinsight对服务进行常规化监控,还能够针对测试服务通过热插拔的形式,随时部署,随时注销,极大的提高了服务测试和预发布环境下对服务性能指标的控制能力。这对于服务测试的临时监控需求、新服务上线的初期监控需求,在相关配套设施没有建设完善时,Infinsight可以极大的节省在服务稳定性管理上的人力成本。

此外,由于Infinsight是一个面向微服务的无agent系统,这也就决定了Infinsight具备对于服务的混合监控能力。用户服务无论在云上、云下,还是跨云部署,只要具备良好的网络连通性,Infinshgit都可以对整体系统进行全面的监控,不会受到由于无权部署agent而缺乏监控能力的问题。并且,由于服务自身就是agent,所以也节省了部署agent的资源开销,对于服务自身来说,1qps几乎没有任何资源消耗。

功能介绍

Infinsight致力于为用户提供最简单最便捷的监控服务,并提供相关的配置模版以及配置脚本,通过默认配置,标准化模版,使用户无需进行复杂的配置,服务的特点如下:

1

  1. Infinsight是一个无agent系统,使用本地客户端对目标服务进行远程采集,所以Infinsight可以实现最小化单机部署。
  2. Infinsight是一个准实时系统,一方面可以以1秒为最小粒度进行高精度的数据采集,另一方面能够以很高的时效性展示系统的当前状态,目标服务任何细微的变化都可以在1秒以内通过可视化页面进行展示。
  3. Infinsight是一个高性能的服务,可以在单机规模对上万个进程进行监控(实际情况需要根据机器性能进行评估),数据查询性能为毫秒级
  4. Infinsight具有非常高的数据压缩比,能够在TB级的存储规模,存储万亿级的数据,可实现以很低的成本保存上万实例一个月的秒级粒度数据。根据线上实际服务情况,MongoDB的数据压缩率比为32:1,Redis Proxy服务数据压缩比为80:1。
  5. Infinsight无需指定监控服务的schema,Infinsight会自动抓取目标服务的全部数据,如果用户需要对监控项进行增删,只需要按照格式(bson、json、key-value)增加或删除对应的监控项目即可,Infinsight会自动根据格式感知到监控项的变化,进行自动化的适配。
  6. Infinsight是一个可进行分布式水平扩展的服务,用户只需要对已部署的Infinsight服务进行原样拷贝,在其他机器上直接启动即可,Infinsight会自动进行服务注册,并根据拓扑结构自动进行负载均衡。
  7. Infinsight支持灵活的前端计算功能,用户可以根据简单的逻辑需求通过对数据进行简单计算从而实现灵活的监控能力

未来规划

Infinsight后续会继续纳入更多的常用服务监控,例如kafka、flink等,为大多数用户解决常见服务的监控问题。在此基础上,不断借助开源的力量,吸纳更多领域从业人员和技术专家们提供针对监控服务可视化模版,给更多的用户提供更专业更美观的服务体验。

技术细节

详细技术细节,参考github wiki: Infinsight技术文档

开源

目前Infinsight已经在github上开源:Infinsight

目录
相关文章
|
安全 Java Linux
ElasticSearch下载与安装
ElasticSearch下载与安装
3820 0
ElasticSearch下载与安装
|
SQL 缓存 关系型数据库
MySQL调优之关联查询、子查询优化
MySQL调优之关联查询、子查询优化
1752 0
|
Web App开发 应用服务中间件 PHP
|
SQL 存储 弹性计算
阿里云EMR 2.0:重新定义新一代开源大数据平台
本次分享主要介绍了阿里云E-MapReduce的开发历程,EMR 2.0的新特性、产品架构,以及EMR 2.0在平台体验、数据开发、资源形态及分析场景等方面的全面突破与创新,重新定义新一代开源大数据平台。
3497 0
阿里云EMR 2.0:重新定义新一代开源大数据平台
|
4月前
|
存储 人工智能 数据可视化
Agent设计思路:从“智能”到“智慧”的企业级解决方案
JBoltAI提出“双轨制”企业级智能体架构:以节点化思维链保障高确定性流程100%稳定执行,以Skills经验库存储可复用的实战规划模板,实现意图匹配与强指导。二者协同构建自主神经系统,兼顾智能性、可控性与可审计性,推动AI从“智能”迈向可信赖的“企业智慧”。(239字)
203 0
|
6月前
|
消息中间件 存储 人工智能
官宣上线!RocketMQ for AI:企业级 AI 应用异步通信首选方案
RocketMQ推出专为AI场景优化的LiteTopic模型,助力企业应对AI应用长耗时、高算力成本与流量波动等挑战,支持异步通信、会话连续性与资源高效调度,已在阿里云及集团内部落地验证。
296 0
官宣上线!RocketMQ for AI:企业级 AI 应用异步通信首选方案
|
SQL NoSQL 前端开发
MySQL 连接数过多的处理方法合集 - Too many connections - 卡拉云
碰到`Can not connect to MySQL server. Too many connections”-mysql`错误着实令人抓狂。这基本等于失去了对 MySQL 的控制权。本教程将详细讲解多种处理此错误的方法。 sudo mysql -uroot -p ERROR 1040 (00000): Too many connections
25748 1
贝叶斯统计中常见先验分布选择方法总结
本文详细介绍了贝叶斯统计中三种常见的先验分布选择方法:经验贝叶斯方法、信息先验和无信息/弱信息先验。
821 3
贝叶斯统计中常见先验分布选择方法总结
|
数据采集 分布式计算 监控
月之暗面Kimi大模型海量数据预处理实践
加速大模型的训练迭代,在模型数据预处理方面,需要高性价比、弹性灵活的 CPU 和 GPU 算力满足模型迭代的业务实践。