可观测监控 Prometheus 版

首页 标签 可观测监控 Prometheus 版
# 可观测监控 Prometheus 版 #
关注
2097内容
Spring Boot Actuator 整合 Prometheus
Spring Boot 自带监控功能 Actuator,可以帮助实现对程序内部运行情况监控,比如监控状况、Bean加载情况、环境变量、日志信息、线程信息等。这一节结合 Prometheus 、Grafana 来更加直观的展示这些信息。
【翻译】Prometheus 2.5.0 新特性
Prometheus 2.5.0 现在(2018.11.12)已经发布,在 9 月份的 2.4.0 之后又进行了一些修正和改进。 这是新的6周计划的第二次发布。第一个重要的特性是,基于我们内部用于单元测试PromQL本身的语法,现在promtool中对规则和警报进行了单元测试。
尝鲜阿里云容器服务Kubernetes 1.16,共享TensorFlow实验室
尝鲜阿里云容器服务Kubernetes 1.16,拥抱GPU新姿势-v4 简介 TensorFLow是深度学习和机器学习最流行的开源框架,它最初是由Google研究团队开发的并致力于解决深度神经网络的机器学习研究,从2015年开源到现在得到了广泛的应用。
【翻译】Prometheus 2.3.0 新特性
Prometheus 2.3.0 现在(2018.6.11)已经发布,在 3 月份的 2.2.0 之后又进行了一些修正和改进。 这个版本中最大的变化是与性能相关的。我对PromQL的评估方式进行了重大更改,这可以为常见仪表板查询减少31-64%的CPU和55-99%的内存分配。
Feign 调用丢失Header的解决方案
在 Spring Cloud 中 微服务之间的调用会用到Feign,但是在默认情况下,Feign 调用远程服务存在Header请求头丢失问题。
【翻译】Prometheus 2.2.0 新特性
Prometheus 2.2.0 现在(2018.3.12)已经发布,在 1 月份的 2.1.0 之后又进行了一些修正和改进。 这个版本的存储格式发生了变化,所以一旦升级到2.2.0,就不可能降级回去。
【翻译】Prometheus 2.4.0 新特性
Prometheus 2.4.0 现在(2018.9.17)已经发布,在 6 月份的 2.3.0 之后又进行了一些修正和改进。 第一个较大的变化是,对于警报中的状态,现在跨重启持久化,因此短暂的重启将不再需要挂起警报从头开始。
| |
来自: 云原生
体验托管Prometheus监控阿里云容器服务Kubernetes的GPU资源
通过ARMS管理Kubernetes集群GPU性能指标 在阿里云容器服务中使用GPU资源运行进行AI模型训练和预测时,经常需要了解应用负载的GPU的使用情况,比如每块显存使用情况、GPU利用率,GPU卡温度等监控信息,通过内置ARMS可以从应用的维度去观测GPU的使用情况,了解资源水位,以及设定相应的报警,避免因为GPU资源的约束引发业务风险。
蚂蚁金服轻量级监控分析系统 SOFALookout 服务端开源
SOFA Scalable Open Financial Architecture 是蚂蚁金服自主研发的金融级分布式中间件,包含了构建金融级云原生架构所需的各个组件,是在金融场景里锤炼出来的最佳实践。
免费试用