计算巢服务:接入阿里云Prometheus的配置文档(ISV填写)

本文涉及的产品
云服务器 ECS,每月免费额度200元 3个月
云服务器ECS,u1 2核4GB 1个月
简介: 文档目的为了实现在 私有部署 场景下,计算巢ISV服务接入prometheus云产品统一监控,prometheus侧需要ISV提供计算巢服务的相关信息,以便配置监控的指标采集、大盘模板、告警指标模板等。注:当前阶段先实现prometheus配置的人工接入,后续流程和能力完善后,考虑ISV自助化接入。读者对象计算巢ISV的研发/运维人员。ISV提供配置信息ISV服务简述(强制要求)一句话描述该ISV

文档目的

为了实现在 私有部署 场景下,计算巢ISV服务接入prometheus云产品统一监控,prometheus侧需要ISV提供计算巢服务的相关信息,以便配置监控的指标采集、大盘模板、告警指标模板等。

注:当前阶段先实现prometheus配置的人工接入,后续流程和能力完善后,考虑ISV自助化接入。

读者对象

计算巢ISV的研发/运维人员。

ISV提供配置信息

ISV服务简述(强制要求)

一句话描述该ISV服务监控,以便prometheus控制台展示给最终用户。TiDB服务简述示例:

计算巢服务名:TiDB
计算巢服务英文名:TiDB
服务监控描述:全面监测TiDB的TiDBServer、TiKVServer和TiPDServer等指标。

请ISV将“服务监控简述”贴于此处。

prometheus exporter(建议提供)

ISV提供的服务有两类:

  • 服务自身已经暴露prometheus metrics(如TiDB):ISV忽略此步骤要求。
  • 需要独立的prometheus exporter来暴露metrics(如nebula):建议ISV提供或推荐开源exporter,以便prometheus部署该exporter来采集对应ISV服务的metric。如果ISV提供自研的exporter,则要求提供源码和使用说明文档,以便prometheus侧对其进行适配。

请ISV将“自研exporter源代码和使用说明”或“开源exporter链接”贴于此处。

指标采集配置(强制要求)

目前 私有部署 的ISV服务,prometheus侧都采集ECS标签方式来进行prometheus targets的过滤选择(每60秒刷新一次):

  • 服务自身已经暴露metrics:prometheus原生支持ECS标签过滤(但只支持一个标签key/value)。
  • 需要exporter暴露metrics:prometheus侧统一对exporter进行改造,使其支持ECS标签过滤。

故,先请ISV提供其服务的指标采集配置说明,然后prometheus侧研发人员对接确认,最终生成prometheus job配置模板。

请ISV将“指标采集配置”示例或描述 贴于此处。

grafana大盘模板(建议提供)

对于ISV提供的某个服务,如果ISV有成熟的 或 推荐的 grafana监控大盘,则请ISV提供给prometheus产品侧,以便我们直接使用/参考。

如果ISV没有提供grafana大盘,则prometheus侧参考该“ISV服务”的开源grafana大盘,定制对应的大盘。

请ISV将“grafana大盘”导出的json文件贴于此处(如果有多个大盘,则会有多个json文件)。

告警指标模板(强制要求)

请ISV提供对应计算巢服务的告警规则列表,采用标准prometheus alert格式。示例如下:

groups:
- name: test
  rules:
  - alert: 内存使用率过高
    expr: 100-(node_memory_Buffers_bytes+node_memory_Cached_bytes+node_memory_MemFree_bytes)/node_memory_MemTotal_bytes*100 > 90
    for: 30s                     # 告警持续时间,超过这个时间才会发送给alertmanager
    labels:
      severity: warning
    annotations:
      summary: "Instance {
  { $labels.instance }} 内存使用率过高"
      description: "{
  { $labels.instance }} of job {
  {$labels.job}}内存使用率超过80%,当前使用率[{
  { $value }}]."

  - alert: cpu使用率过高
    expr: 100-avg(irate(node_cpu_seconds_total{mode="idle"}[5m])) by(instance)*100 > 90
    for: 30s
    labels:
      severity: warning
    annotations:
      summary: "Instance {
  { $labels.instance }} cpu使用率过高"
      description: "{
  { $labels.instance }} of job {
  {$labels.job}}cpu使用率超过80%,当前使用率[{
  { $value }}]."

请ISV将“prometheus告警规则”yaml文件贴于此处(可以多个文件)。

指标列表(建议提供)

请ISV提供对应计算巢服务的prometheus指标列表,格式采集标准prometheus指标规范。示例如下:

# HELP pd_server_info Indicate the pd server info, and the value is the start timestamp (s).
# TYPE pd_server_info gauge

如果ISV服务未提供该指标列表,则prometheus侧将根据实际metric采集的HELP和TYPE来生成指标列表,并会在prometheus控制台界面展示给用户。

请ISV将“prometheus指标HELP和TYPE”的文件贴于此处(可以多个文件)。

特殊要求说明(可选提供)

请ISV将“prometheus监控特殊要求”贴于此处。

相关实践学习
一小时快速掌握 SQL 语法
本实验带您学习SQL的基础语法,快速入门SQL。
7天玩转云服务器
云服务器ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,可降低 IT 成本,提升运维效率。本课程手把手带你了解ECS、掌握基本操作、动手实操快照管理、镜像管理等。了解产品详情: https://www.aliyun.com/product/ecs
相关文章
|
11天前
|
存储 弹性计算 固态存储
阿里云服务器CPU内存配置详细指南,如何选择合适云服务器配置?
阿里云服务器配置选择涉及CPU、内存、公网带宽和磁盘。个人开发者或中小企业推荐使用轻量应用服务器或ECS经济型e实例,如2核2G3M配置,适合低流量网站。企业用户则应选择企业级独享型ECS,如通用算力型u1、计算型c7或通用型g7,至少2核4G配置,公网带宽建议5M,系统盘可选SSD或ESSD云盘。选择时考虑实际应用需求和性能稳定性。
118 6
|
6天前
|
存储 弹性计算 固态存储
阿里云服务器租用价格参考,2核16G、4核32G、8核64G配置收费标准
阿里云服务器2核16G、4核32G、8核64G配置最新租用价格更新,2024年阿里云产品再一次降价,降价之后2核16G配置按量收费最低收费标准为0.596元/小时,按月租用标准收费标准为260.44元/1个月。4核32G配置的阿里云服务器按量收费标准最低为1.085元/小时,按月租用标准收费标准为520.88元/1个月。8核64G配置的阿里云服务器按量收费标准最低为2.17元/小时,按月租用标准收费标准为1041.77元/1个月。云服务器实例规格的地域和实例规格不同,收费标准不一样,下面是2024年阿里云服务器2核16G、4核32G、8核64G配置的最新租用收费标准。
阿里云服务器租用价格参考,2核16G、4核32G、8核64G配置收费标准
|
7天前
|
存储 弹性计算 固态存储
阿里云服务器配置选择指南,2024年全解析
阿里云服务器配置选择涉及CPU、内存、带宽和磁盘。个人开发者或中小企业推荐使用轻量应用服务器或ECS经济型实例,如2核2G3M配置,适合网站和轻量应用。企业用户则应选择企业级独享型ECS,如计算型c7、通用型g7,至少2核4G起,带宽建议5M,系统盘考虑SSD云盘或ESSD云盘以保证性能。阿里云提供了多种实例类型和配置,用户需根据实际需求进行选择。
|
11天前
|
存储 弹性计算 固态存储
阿里云服务器配置怎么选择合适?收藏级教程大家参考下
阿里云服务器配置选择涉及CPU、内存、带宽和磁盘。个人开发者或中小企业推荐使用轻量应用服务器或ECS经济型实例,如2核2G3M配置,适合低流量网站。企业用户应选择企业级独享型ECS,如通用算力型u1、计算型c7或通用型g7,至少2核4G配置,公网带宽建议5M,系统盘可选SSD或ESSD云盘。具体配置需根据实际应用需求来定。
|
12天前
|
存储 弹性计算 运维
深度解读:阿里云服务器ECS经济型e实例配置整理和性能参数表
阿里云推出经济型ECS e系列服务器,适用于个人开发者、学生和小微企业。该系列采用Intel Xeon Platinum处理器,支持多种CPU内存配比,性价比高,2核2G3M配置只需99元/年,新老用户不限量购买且续费不涨价。提供相同可用性SLA和安全标准,具备ESSD Entry云盘等企业级特性。适合中小型网站、开发测试和轻量级应用
|
14天前
|
运维 监控 关系型数据库
Serverless 应用引擎产品使用之在阿里云函数计算(FC)中,要访问另一个账号的rds配置rds的白名单如何解决
阿里云Serverless 应用引擎(SAE)提供了完整的微服务应用生命周期管理能力,包括应用部署、服务治理、开发运维、资源管理等功能,并通过扩展功能支持多环境管理、API Gateway、事件驱动等高级应用场景,帮助企业快速构建、部署、运维和扩展微服务架构,实现Serverless化的应用部署与运维模式。以下是对SAE产品使用合集的概述,包括应用管理、服务治理、开发运维、资源管理等方面。
30 0
|
18天前
|
网络协议 对象存储
阿里云oss配置自有域名
阿里云oss配置自有域名
24 1
|
13天前
|
域名解析 弹性计算 Linux
阿里云购买云服务器、注册域名、备案及绑定图文教程参考
本文为大家介绍了2024年购买阿里云服务器和注册域名,绑定以及备案的教程,适合需要在阿里云购买云服务器、注册域名并备案的用户参考,新手用户可通过此文您了解在从购买云服务器到完成备案的流程。
阿里云购买云服务器、注册域名、备案及绑定图文教程参考
|
2天前
|
负载均衡 固态存储 Linux
阿里云轻量应用服务器、云服务器、gpu云服务器最新收费标准参考
轻量应用服务器、云服务器、gpu云服务器是阿里云服务器产品中,比较热门的云服务器产品类型,不同类型的云服务器产品收费模式与收费标准是不一样的,本文为大家展示这几个云服务器产品的最新收费标准情况,以供参考。
阿里云轻量应用服务器、云服务器、gpu云服务器最新收费标准参考
|
2天前
|
弹性计算 负载均衡 容灾
应用阿里云弹性计算:打造高可用性云服务器ECS架构
阿里云弹性计算助力构建高可用云服务器ECS架构,通过实例分布、负载均衡、弹性IP、数据备份及多可用区部署,确保业务连续稳定。自动容错和迁移功能进一步增强容灾能力,提供全方位高可用保障。
11 0