为什么要做指标分类
- 存储要做分离 - 查询采集等也要分离 - 可用性重要程度做区分: 在线业务指标> 在线中间件指标 > 在线基础资源指标 > 离线业务指标 > 大数据指标
指标分类
- 基础资源指标 如机器or容器的cpu、mem使⽤率 - 中间件指标 如kafka offset、redis cache情况、mysql 连接数 - 业务研发引⼊sdk埋点指标 如服务延迟、请求qps - ⼤数据指标 单独分类是autoscaling问题 >
k8s中的指标分类
|容器基础资源指标 | kubelet 内置cadvisor metrics接口 | 查看容器cpu、mem利用率等 |k8s_sd node级别直接访问
kube-stats-metrics (简称ksm) | 具体可以看从容器监控kube-stats-metrics看k8s众多组件 看pod状态如pod waiting状态的原因 数个数如:查看node pod按namespace分布情况 |通过coredns访问域名|
标| 服务组件 metrics接口 | 查看apiserver 、scheduler、etc、coredns请求延迟等 | k8s_sd endpoint级别 |
pod 的metrics接口 | 依据业务指标场景 | k8s_sd pod级别,访问pod ip的metricspath |
采集模式
- pull模型 - push模型 > exporter分离 - 单实例采集:必须本机部署的exporter - 多实例采集:可以远端部署的exporter > target配置模式 - 静态配置模式 - 动态服务发现模式