Prometheus监控实践:Kubernetes集群监控
本文将总结一下我们目前使用Prometheus对Kubernetes集群监控的实践。 我们选择Prometheus作为监控系统主要在以下各层面实现监控:
基础设施层:监控各个主机服务器资源(包括Kubernetes的Node和非Kubernetes的Node),如CPU,内存,网络吞吐和带宽占用,磁盘I/O和磁盘使用等指标。
Spark Operator浅析
Spark Operator浅析
本文介绍Spark Operator的设计和实现相关的内容.
Spark运行时架构
经过近几年的高速发展,分布式计算框架的架构逐渐趋同. 资源管理模块作为其中最通用的模块逐渐与框架解耦,独立成通用的组件.
开源AIOps数据中台搭建
本文介绍我在PyCon2019上海站的议题内容,根据Gartner的报告,AIOps将在未来5-10年落地开花,并集中统一各种Ops平台,本议题介绍AIOps的核心作用、相关工程难点(数据采集、数据中台、智能算法、自动化等)与开源方案选择,适当介绍了Python在其中的主要作用。
使用 Prometheus 监控 Docker 容器
本文讲的是使用 Prometheus 监控 Docker 容器,【编者的话】Prometheus支持深度监控Docker容器的资源和运行特性,多维度查询,聚合Docker监控数据,作者认为Prometheus是最适合基于容器架构的监控系统,其特性是高纬度数据模型和灵活的查询语言 。