CIG重量级监控

简介: CIG方案由CAdvisor(监控)、InfluxDB(存储)和Grafana(展示)组成,实现容器资源的全面监控。CAdvisor采集CPU、内存、网络等数据,存入InfluxDB持久化,Grafana读取并可视化,支持图表展示与报警,适用于Docker环境的性能监控与分析。

CIG
通过docker stats 命令可以很方便的查看当前宿主机上所有容器的CPU、内存、网络流量等数据,可以满足一些小型应用。
但是 docker stats 统计结果只能是当前宿主机的全部容器,数据资料是实时的,没有地方存储、没有健康指标过线预警等功能。

CAdvisor(监控收集) + InfluxDB(存储数据) + Granfana(展示图表),合称 CIG。
CADVISORINFLUXDB存储CADVISORCADVISOR分析.数据显示.WEB展示GRAFANA
CIG.png

CAdvisor

CAdvisor是一个容器资源监控工具,包括容器的内存、CPU、网络IO、磁盘IO等监控,同时提供了一个Web页面用于查看容器的实时运行状态。

CAdvisor默认存储2分钟的数据,而且只是针对单物理机。不过CAdvisor提供了很多数据集成接口,支持 InfluxDB、Redis、Kafka、Elasticsearch等集成,可以加上对应配置将监控数据发往这些数据库存储起来。

CAdvisor主要功能:

展示Host和容器两个层次的监控数据

展示历史变化数据

InfluxDB

InfluxDB是用Go语言编写的一个开源分布式时序、事件和指标数据库,无需外部依赖。

CAdvisor默认只在本机保存2分钟的数据,为了持久化存储数据和统一收集展示监控数据,需要将数据存储到InfluxDB中。InfluxDB是一个时序数据库,专门用于存储时序相关数据,很适合存储 CAdvisor 的数据。而且 CAdvisor本身已经提供了InfluxDB的集成方法,在启动容器时指定配置即可。

InfluxDB主要功能:

基于时间序列,支持与时间有关的相关函数(如最大、最小、求和等)

可度量性,可以实时对大量数据进行计算

基于事件,支持任意的事件数据

Granfana
Grafana是一个开源的数据监控分析可视化平台,支持多种数据源配置(支持的数据源包括InfluxDB、MySQL、Elasticsearch、OpenTSDB、Graphite等)和丰富的插件及模板功能,支持图表权限控制和报警。

Granfana主要功能:

灵活丰富的图形化选项

可以混合多种风格

支持白天和夜间模式

多个数据源

安装部署
1
编写docker-compose.yml服务编排文件

2
检查语法

3
创建并启动容器

容器启动之后:
1
在浏览器打开InfluxDB数据库的页面: http://xxx.xxx.xxx.xxx:8083,使用命令查看当前数据库中的数据库实例:
Plain Text
复制代码
1
SHOW DATABASES

查看其中是否自动创建了我们在配置文件中配置的 cadvisor 数据库实例
2
在浏览器打开CAdvisor页面:http://xxx.xxx.xxx.xxx8080/,查看当前docker中的cpu、内存、网络IO等统计信息
3
在浏览器打开Grafana页面:http://xxx.xxx.xxx.xxx:3000/,默认用户名密码是:admin/admin。

Grafana配置
添加数据源
在Configuration(小齿轮)选项卡中,选择Data Sources,添加一个InfluxDB数据源:

name:自定义一个数据源名称,例如InfluxDB

Query Language:查询语言,默认InfluxQL即可

URL:根据compose中的容器服务名连接,http://influxdb:8086

database:我们在InfluxDB中创建的数据库实例,cadvisor

User:InfluxDB的默认用户,root

Password:root

保存并测试,可以连通即可
添加工作台
1
在Create(加号)选项卡中,选择创建 Dash Board工作台。右上角配置中可以配置创建出来的工作台的标题、文件夹等信息。
2
在创建出来的工作台中,选择Add panel中的Add a new panel添加一个新的面板。
a
在右上角Time series(时序图)位置可以切换展示的图表样式(柱状图、仪表盘、表格、饼图等等)
b
右侧边栏为该图表配置相关信息:标题、描述
c
图表下方可以配置该图表展示的数据的查询语句,例如:

FROM:cpu_usage_total(Grafana会自动获取InfluxDB数据库中的元数据,可以直接选择对应表名)

WHERE:添加一个条件,container_name=cig-cadvisor-1

ALIAS:配置一个别名,CPU使用情况汇总

目录
相关文章
|
运维 Cloud Native Devops
「译文」什么是 SRE(站点可靠性工程师)?SRE 是做什么的?
「译文」什么是 SRE(站点可靠性工程师)?SRE 是做什么的?
|
4月前
|
Linux 虚拟化 iOS开发
VMware Workstation Pro 25H2u1 Unlocker & OEM BIOS 2.7 - 在 Windows 和 Linux 上运行 macOS Tahoe
VMware Workstation Pro 25H2u1 Unlocker & OEM BIOS 2.7 for Windows & Linux - 在 Windows 和 Linux 上运行 macOS Tahoe
995 1
VMware Workstation Pro 25H2u1 Unlocker & OEM BIOS 2.7 - 在 Windows 和 Linux 上运行 macOS Tahoe
|
4月前
|
机器学习/深度学习 数据采集 人工智能
大模型强化学习全解:从PPO、DPO到DeepSeek的GRPO,一文搞懂强化对齐的奥秘
本文用生活化比喻详解大模型强化学习三大主流方法:PPO(精准但昂贵的“私教班”)、DPO(依赖高质量数据的“改错本”)、GRPO(DeepSeek创新的“小组竞赛制”)。零公式、重逻辑,帮你理解RL如何让模型从“会说”进阶为“说好”。
|
6月前
|
机器学习/深度学习
SAPO:让强化学习告别“硬剪切”
SAPO提出一种稳定高效的大语言模型强化学习方法,通过平滑门控替代硬剪切,解决GRPO/GSPO梯度丢失与不稳定问题。其连续信任域、序列级一致性及token级自适应设计,显著提升训练稳定性与样本效率,适用于dense/MoE模型,在数学、代码、逻辑等多任务上表现优越。
757 9
|
7月前
|
存储 弹性计算 固态存储
阿里云服务器按量付费与包年包月收费标准,云服务器最新活动价格参考
阿里云的价格一直是用户最为关注的,阿里云这两年也多次做了降价策略,阿里云根据用户的实际需求,针对云服务器收费模式推出按量付费与包年包月两种收费模式,云服务器价格表2025最新版,轻量应用服务器38元一年起,ECS云服务器2核2G3M带宽99元1年、2核4G5M带宽199元一年,新品通用算力型u2i实例4核4G1120.44元/1年起、4核8G1170.26元/1年起,九代云服务器计算型c9i实例8核16G6037.01元/1年起、通用型g9i实例8核32G7551.94元/1年起、内存型r9i实例8核64G9937.12元/1年起。叠加阿里云推出的各种优惠券还可享受满减优惠。
|
6月前
|
机器学习/深度学习 弹性计算 人工智能
最新版:云服务器租用价格表(一年/按月/按小时报价明细)
阿里云服务器主要包含轻量应用服务器、云服务器 ECS 和 GPU 服务器三大类,不同类型、配置及计费方式的价格存在差异。以下结合最新信息,整理各类服务器的收费标准、价格构成及不同场景下的参考价格,为用户成本核算提供依据。
|
人工智能 监控 Java
基于 eBPF 技术打造的 LightAPM 应用监控,效果如何
本文介绍如何利用LightAPM解决“古早应用”(如银行老核心、证券交易系统)的监控难题。这些基于C/C++或老旧JDK的系统封闭且难以改造,传统字节码增强技术无法适用。通过部署集成eBPF技术的OneAgent,LightAPM实现无侵入、开箱即用的监控,自动绘制服务拓扑、发现服务并采集应用与基础设施指标,支持多JDK混合环境。结合因果AI,还可智能告警与根因定位,为遗留系统提供高效可观测性方案。
基于 eBPF 技术打造的 LightAPM 应用监控,效果如何
|
10月前
|
Linux 虚拟化 iOS开发
macOS Tahoe 26 beta 7 (25A5346a) Boot ISO 原版可引导镜像下载
macOS Tahoe 26 beta 7 (25A5346a) Boot ISO 原版可引导镜像下载
702 0
macOS Tahoe 26 beta 7 (25A5346a) Boot ISO 原版可引导镜像下载