为了支持日益增长的用户请求流量,大规模系统架构追求服务实例无状态可水平扩展的特性。这就要求流量均匀分配到各服务实例,容器和节点的资源使用也尽可能平均,否则热点问题将严重拖累系统性能,导致严重故障。
因此,如何从流量及资源两个维度的监控数据,快速发现热点问题,提前消除隐患,成为kubernetes监控的重点。
云原生可观测基于Prometheus、Grafana 、OpenTelemetry 等核心产品, 形成指标、链路存储分析、异构数据源集成的数据层, 通过标准PromQL和SQL提供大盘展示、告警与探索能力。