计算巢私有化部署接入Prometheus监控最佳实践说明

简介: 计算巢简介计算巢是阿里云开放给ISV与其客户的服务管理PaaS平台,旨在解决ISV云上交付、部署、运维问题,建立ISV与客户之间的通道。针对ISV的实际场景,计算巢提供了私有化部署、托管版部署、代运维服务三种模式。托管版和私有化部署的区别是针对于部署在ISV的账号下还是部署在用户账号下。本文主要介绍私有化部署服务支持Prometheus监控的功能。功能概述目的是支持服务商通过自定义监控指标、监控大

计算巢简介

计算巢是阿里云开放给ISV与其客户的服务管理PaaS平台,旨在解决ISV云上交付、部署、运维问题,建立ISV与客户之间的通道。针对ISV的实际场景,计算巢提供了私有化部署、托管版部署、代运维服务三种模式。托管版和私有化部署的区别是针对于部署在ISV的账号下还是部署在用户账号下。本文主要介绍私有化部署服务支持Prometheus监控的功能。

功能概述

目的是支持服务商通过自定义监控指标、监控大盘、报警规则,来实现应用监控或业务监控。用户在计算巢自动化部署后即可获取配置好的Promethues监控,服务商和用户有独立的监控数据存储,均可以查看资源和应用的监控大盘、获取具体监控数据,并配置报警规则收取报警等。 本文介绍了私有部署服务通过计算巢如何接入阿里云托管的Prometheus服务。Prometheus云产品支持ECS部署和容器部署两种模式。目前计算巢仅支持在ECS部署模式下接入Prometheus,本文主要介绍ECS部署模式下接入Prometheus的最佳实践。

私有化部署接入Promtheus监控的最佳实践

服务商配置流程

前提条件

  1. 创建集成组件:服务商提供Prometheus的接入信息给到ARMS同学,由ARMS同学创建该服务的一个Prometheus集成组件。
  2. 创建RemoteWrite实例:服务商在服务商账号下启用ARMS服务并在 ARMS控制台创建RemoteWrite Prometheus实例。
  1. Remote Write实例创建完成后,会得到内网的remote Write地址。

计算巢服务配置

  1. 填写集成组件配置信息:在私有化服务的配置页面,每个模板下有对应的Prometheus配置,开启Prometheus监控之后,需要配置相应集成组件的配置参数。该参数在提供Prometheus的接入信息给到ARMS同学之后,ARMS同学配置集成组件后,会给出该配置参数。

由于不同模板可能需要不同的配置参数,所以需要对每个模板单独设置Prometheus监控及配置参数。

  1. 填写RemoteWrite信息:只要有一个模板选择开启了Prometheus监控,需要服务商在运维通知配置项下,设置RemoteWrite内网地址和集成组件名称。
  1. 服务商需要在每个部署地域下创建至少一个Prometheus Remote Write实例,只有设置了Remote Write地址的部署地域才能看到监控数据。
  2. 服务商可以为每个服务创建一个Prometheus实例,也可以所有服务共用一个Prometheus实例,计算巢对服务和Prometheus实例的映射关系不做限制。
  3. 集成组件名称由ARMS同学创建集成组件之后给出。

  1. 配置安全组规则:用户的安全组中需要开放Prometheus实例采集数据的端口,Prometheus 实例才能拉取数据,安全组的入方向中需要添加两个规则。
  • 一个是正向访问的,开启内网访问的端口,源地址是VPC的cidrBlock。 
  • 一个是反向访问的,用于Prometheus控制台访问Agent,源地址是固定的.
  1. 配置授权:服务商要查看用户的监控数据,需要用户授权。在创建服务页面的权限设置配置项下,勾选需要用户授权,加上监控权限或全部权限。

  1. 升级功能:如果要支持旧版本的服务实例开启Prometheus监控,服务商可以在该版本下开启升级功能,用户已经创建成功的服务实例升级到此版本下同样具有Prometheus监控的能力。
  2. 查看RemoteWrite大盘链接:在创建服务之后,在服务详情页可以查看Prometheus监控配置。除了在创建服务时填写的配置外,还包括自动为服务商创建的该服务对应的Grafana大盘链接,可以通过此链接查看Remote Write实例中的Grafana大盘。

用户使用流程

创建服务实例

  1. 用户侧在创建服务实例时,如果对应的服务开启了prometheus设置,用户可以选择是否启用Prometheus监控,启用Prometheus监控可以查看服务实例的业务监控数据,此项功能单独收费,详情请见 计费概述。服务实例创建成功之后在服务实例详情页面可以对此配置项进行修改。

  1. 在创建服务实例页面,会进行服务开通检查和权限检查,依赖检查正常服务实例才能创建成功。

  1. 在服务实例创建成功之后,在服务实例详情页可以查看Prometheus的相关配置。可以在此修改用户侧是否启用Prometheus监控,如果开启了Prometheus监控,可以通过查看大盘数据跳转到Grafana。

  1. 用户侧在ARMS控制台,也可以查看服务实例对应的Prometheus实例。Prometheus实例的名称可以在Grafana大盘中看到。

升级服务实例

服务实例升级支持Prometheus监控,旧版本服务下创建的服务实例,可以升级到支持Prometheus的新版本下,自动为该服务实例开启Prometheus功能。

相关实践学习
通义万相文本绘图与人像美化
本解决方案展示了如何利用自研的通义万相AIGC技术在Web服务中实现先进的图像生成。
7天玩转云服务器
云服务器ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,可降低 IT 成本,提升运维效率。本课程手把手带你了解ECS、掌握基本操作、动手实操快照管理、镜像管理等。了解产品详情: https://www.aliyun.com/product/ecs
目录
相关文章
|
3月前
|
人工智能 弹性计算 自然语言处理
从0到1部署大模型,计算巢模型市场让小白秒变专家
阿里云计算巢模型市场依托阿里云弹性计算资源,支持私有化部署,集成通义千问、通义万象、Stable Diffusion等领先AI模型,覆盖大语言模型、文生图、多模态、文生视频等场景。模型部署在用户云账号下,30分钟极速上线,保障数据安全与权限自主控制,适用于企业级私有部署及快速原型验证场景。
|
2月前
|
人工智能 弹性计算 安全
阿里云计算巢私有化MCP市场:企业级AI工具的安全部署新选择
阿里云计算巢私有化MCP市场,依托阿里云弹性计算资源,提供自主可控的私有化部署方案。支持OpenAPI、SSE、StreamableHttp等多种接入方式,结合Higress云原生网关实现高效网络控制,所有工具直接部署在用户云账号下,5分钟极速部署,保障数据安全与使用便捷性。适用于对数据安全要求高、需访问内网资源、服务隔离及统一管理多种MCP工具的企业场景。
|
6月前
|
数据可视化 JavaScript 前端开发
低代码神速开发:ToolJet 计算巢部署宝典 🚀
ToolJet 是一款开源低代码开发平台,支持可视化构建 Web 应用,提供多数据源连接、团队协作、灵活部署及自定义插件扩展等功能。基于 AGPL v3 开源协议,社区活跃度高(GitHub 25k+ Stars)。用户可通过计算巢快速部署 ToolJet 社区版。
|
6月前
|
人工智能 弹性计算 运维
|
7月前
|
弹性计算 API 开发者
DeepSeek R1上线阿里云云市场,可通过计算巢一键部署
DeepSeek R1上线阿里云云市场,可通过计算巢一键部署
|
7月前
|
人工智能 Kubernetes 安全
通过阿里云计算巢部署 NVIDIA NIM,加速企业大语言模型 SaaS 化
通过阿里云计算巢部署 NVIDIA NIM,加速企业大语言模型 SaaS 化
|
11月前
|
Prometheus Kubernetes 监控
k8s部署针对外部服务器的prometheus服务
通过上述步骤,您不仅成功地在Kubernetes集群内部署了Prometheus,还实现了对集群外服务器的有效监控。理解并实施网络配置是关键,确保监控数据的准确无误传输。随着监控需求的增长,您还可以进一步探索Prometheus生态中的其他组件,如Alertmanager、Grafana等,以构建完整的监控与报警体系。
591 62
|
11月前
|
Prometheus Kubernetes 监控
k8s部署针对外部服务器的prometheus服务
通过上述步骤,您不仅成功地在Kubernetes集群内部署了Prometheus,还实现了对集群外服务器的有效监控。理解并实施网络配置是关键,确保监控数据的准确无误传输。随着监控需求的增长,您还可以进一步探索Prometheus生态中的其他组件,如Alertmanager、Grafana等,以构建完整的监控与报警体系。
293 60
|
11月前
|
自然语言处理 PyTorch 算法框架/工具
掌握从零到一的进阶攻略:让你轻松成为BERT微调高手——详解模型微调全流程,含实战代码与最佳实践秘籍,助你应对各类NLP挑战!
【10月更文挑战第1天】随着深度学习技术的进步,预训练模型已成为自然语言处理(NLP)领域的常见实践。这些模型通过大规模数据集训练获得通用语言表示,但需进一步微调以适应特定任务。本文通过简化流程和示例代码,介绍了如何选择预训练模型(如BERT),并利用Python库(如Transformers和PyTorch)进行微调。文章详细说明了数据准备、模型初始化、损失函数定义及训练循环等关键步骤,并提供了评估模型性能的方法。希望本文能帮助读者更好地理解和实现模型微调。
764 2
掌握从零到一的进阶攻略:让你轻松成为BERT微调高手——详解模型微调全流程,含实战代码与最佳实践秘籍,助你应对各类NLP挑战!
|
10月前
|
人工智能 Kubernetes 安全
通过阿里云计算巢部署NVIDIA NIM,加速企业大语言模型SaaS化
在人工智能飞速发展的今天,大语言模型(LLM)为各个行业带来了全新的场景和机遇。诸如客户服务数字人,计算机辅助药物研发的生成式虚拟筛选,基于检索增强生成(RAG)的企业多模态PDF数据提取,网络安全流数据过滤、处理和分类优化等工作流,正在无缝集成和运行在定制化的企业AI应用,企业还能够基于专有业务数据和用户反馈数据,不断优化AI应用。

相关产品

  • 计算巢服务