2021云栖大会开源引力峰会重磅发布的战略合作,Grafana服务到底是什么?

本文涉及的产品
应用实时监控服务-应用监控,每月50GB免费额度
可观测监控 Prometheus 版,每月50GB免费额度
应用实时监控服务-可观测链路OpenTelemetry版,每月50GB免费额度
简介: 这几天关注云栖大会的小伙伴一定会发现阿里巴巴合伙人、阿里云高级研究员蒋江伟(小邪)在云栖大会开源引力峰会的演讲中,特别提到了一个叫 Grafana 服务的产品,并特意花费一页 PPT 介绍了这一次合作。到底是一个什么样的产品值得隆重介绍?

作者 | 幼麒

这几天关注云栖大会的小伙伴一定会发现阿里巴巴合伙人、阿里云高级研究员蒋江伟(小邪)在云栖大会开源引力峰会的演讲中,特别提到了一个叫 Grafana 服务的产品,并特意花费一页 PPT 介绍了这一次合作。到底是一个什么样的产品值得隆重介绍?


4872fcfcbd6c4139b6a42f8a67bb38dc.png


那么,接下来我们一起聊聊 Grafana 服务吧~在正式开始前,大家可以先回答一下以下问题:

  • 你有没有沉浸在购买机器、配置网络、构建环境、安装部署、准备域名和 IP 地址的技术海洋无法自拔?
  • 你有没有遇到过服务起不来无法访问? SLA 无法保障? 或者过一段时间后忘记服务 IP 地址及密码找都找不回来?
  • 你有没有希望集成 ARMS、SLS、云监控、RDS、Trace 等各云产品的数据到统一的大盘而苦于不知从何下手?
  • 你有没有希望 Grafana 连接专有网络 VPC 内各自建数据源业务数据,并提供邮件、短信告警以及定期报告?
  • 你有没有在命令行黑屏安装各种插件和调整配置参数? 一顿操作猛于虎,一看系统心里堵?



什么是 Grafana ?


为了解决上述问题,Grafana 应运而生。Grafana 的官方是这样介绍自己的:Grafana 是开源可视化和分析软件。它允许查询、可视化、提醒和探索指标,无论它们存储在何处。简单地说,提供了将时间序列数据库(TSDB)数据转换为漂亮的图形和可视化的工具。你还不知道什么是 Grafana? 那么你一定看到过下面类似可视化看板,它们就是配置在 Grafana 中。


25f3e7dbbb0b4a4bb32d18617e0bcaa5.png

0d06e54176484fada0b73c29d639b663.png


为什么要做 Grafana 托管服务?


Grafana 作为云原生可观测性的统一展示解决方案,可向下覆盖各类数据源和监控系统。在阿里云上有着成千上万的用户通过自己搭建 Grafana 来完成数据的可视化展示,他们在使用 Grafana 时也要忍受运维部署、个性设置、账号管理、阿里云数据源对接、告警等各方面不便。


正是为了解决用户在使用 Grafana 的各种痛点,我们云原生团队与 Grafana 官方(Grafana Labs)进行了长达一年的沟通洽谈并达成合作,目前 Grafana 托管服务正在公测(申请地址详见文末)。此次合作,也是 Grafana 与亚太地区云厂商的首次深度合作,双方将在中国区提供首款 Grafana 托管服务。

详见:Grafana Labs 携手阿里云,将提供国内首款 Grafana 托管服务


在这一过程中,我们在做了些什么?


在确定系统架构前,我们明确作为 Grafana 托管服务产品,用户存在的众多诉求,这其中包括:

  • 自建 Grafana 迁移至托管 Grafana 的便利性(迁移工具/配置导入);
  • 全托管的自动弹性(免服务器运维、高可用);
  • 支持多方数据源(ARMS、Prometheus、SLS、用户自建数据源) 、报警功能集成;
  • 阿里云官方数据源预建数据大盘;
  • 数据访问安全(云账户管理 /子账号授权 / 用户组/用户授权);
  • 提供多种版本选择、插件版本选择、 企业级插件支持;
  • 提供独立的访问域名/链接。


所以我们在系统架构设计选型时要综合考虑上述各个因素,为用户提供稳定易用,功能强大的 Grafana 托管服务。如:

  • 为了更好的运维管理和成本考虑,托管服务集群采用 ACK 集群;
  • 为了保证各用户数据隔离安全和数据库升级迁移维护的便利性,我们采用独立数据库方案(目前 NAS sqllite);
  • 为了能够连通客户各 VPC 内数据及综合考虑性能、成本及支持 VPC 范围,我们采用双网卡打通+FC 网络打通;
  • 其他如服务状态机设计、云服务接入、用户鉴权、授权、独立域名等都是经过考虑权衡;


aa6f09dd6efe4f329c86aed38c8d5281.png


如上图所示,中间层通过 ACK 集群托管客户 Grafana 实例,在其下面对接云服务数据源、VPC 内数据源(FC 通道)、其他云服务数据源。其上层通过对接各外部服务,分为客户提供 Grafana 服务和控制台:

  • 客户使用(服务本身),Client -> Proxy -> Grafana
  • 监控管理(控制台),Client -> Console -> Grafana


下图为用户开通使用 Grafana 整个流程:
从管控端来看,管理员用户或者主账号,通过控制台开通并购买 Grafana 工作区,并完成对其他用户或者子账号的授权,此时我们会在 ACK 集群为用户创建独立的 Grafana Pod 实例及一系列的配套资源(如:NAS 存储、配置、自监控、告警集成、默认插件、云服务集成等);从 Grafana 的使用管理来看,Grafana 实际用户或者子账号登录 Grafana 工作区,就可正常的完成配置数据源,大盘面板等;如果管理员配置了 VPC 打通能力,那么也可以通过我们的数据 Proxy 访问到该客户 VPC 内的数据源。


fbd5ca52d1204215a012470ca8d9ba65.png



Grafana 服务提供了哪些功能?



1、功能演示


申请公测后,我们会每周定期进行审批,届时您将可以体验 Grafana 托管服务。


各模块简单描述如下:

  • 首页:首先进入系统首页 会展示 Grafana 核心优势和功能,以及接入步骤;
  • 目前在 ARMS 域名下,后续会提供独立域名及入口;
  • 创建工作区:在进入欢迎页面后,即可点击"创建工作区"按钮创建 Grafana 托管服务
  • 公测期间创建工作区不收取任何费用,您只需要简单的填写表单即可。
  • 版本类型:公测期间只提供标准版,后续会提供企业版供您选择。
  • 版本号:公测期间只提供 7.5.x 版本,后续会提供 8.1.x 等版本供您选择。
  • 密码:是指 admin 账号的登录密码,您也可以不使用该密码直接使用阿里云账号登录。
  • 工作区列表:在创建完成后,即可管理您的 Grafana 工作区
  • 工作区详情:
  • 在工作区详情页,可以查看工作区的各项信息,并点击"登录"按钮直接使用您的 Grafana。
  • 在登录页面 可以选择通过"Alibaba Cloud"登录方式登录后,您即可开始使用 Grafana 服务了。
  • 性能监控:
  • 在性能监控页面可以查看您的工作区各项数据(用户、组织、大盘、资源消耗、请求频率及延迟等)
  • 参数设置:
  • 通过参数设置,您可以白屏化的管理 Grafana 的各项个性化设置
  • 如:Oauth、 服务端口、 domain 免鉴权分享大盘面板等
  • 账号管理:
  • 在账号管理页面您可以重置管理员 Admin 的密码,也可以授权其他账号访问该 Grafana 实例。
  • 后续会增加通过 SMTP 邀请用户加入该 Grafana 工作区功能;
  • 云服务管理:
  • 云服务管理功能 目前支持 ARMS Prometheus 数据源及大盘同步至 Grafana 工作区。
  • 另外还支持 SLS CMS 的数据源配置(配置方式见页面帮助文档);
  • 除支持上述云服务数据源外,ARMS 前端监控、ARMS 链路监控数据接入也在规划中;
  • VPC 数据源通道管理:
  • 通过指定 VPC、交换机、安全组后 即可安装 VPC 数据源通道,这样在 Grafana 上访问 VPC 内数据源,
  • 访问 VPC 内数据源,就像当前 Grafana 部署在 VPC 内一样(使用方式详见页面帮助文档)
  • 告警管理:
  • 告警管理集成 ARMS 告警通道,用户只需要简单配置下联系人,就可以在 Grafana 配置 Alerting 规则;
  • 插件管理:
  • 插件管理功能,提供便利的安装 卸载插件功能,用户无需关心底层命令和重启 配置调整等繁琐的技术细节;


2、核心优势


  • 弹性、免运维:通过 Grafana 托管服务,无需管理运维服务器即可使用高可用服务。
  • 统一可视化:支持阿里云各数据源(如 ARMS、阿里云 Prometheus 监控、SLS 等)以及自建数据源和第三方云厂商数据源(后续将支持云监控、链路监控、前端监控数据)。
  • 数据安全与授权:支持阿里云账号 SSO 和自建账号体系,实现数据源与大盘的精细化管理 以及数据备份恢复(开发中)。
  • 跨多 VPC 数据访问:支持同一个 Grafana 工作区通过私网连接多个专有网络 VPC 内数据源。


3、功能特性


  • 默认集成各种云服务 默认集成 ARMS、阿里云 Prometheus 监控、云监控、SLS、阿里云 Elasticsearch 等云服务,并提供各种云服务的数据源配置、预置大盘与一键告警。
  • 多种插件任意选可以使用 Grafana 插件连接您的工具和您的团队。数据源插件通过API连接到现有数据源并实时呈现数据,而无需您手动获取或迁移数据。
  • 自定义告警体系使用 Grafana 告警,您可以在一个简单的UI中创建、管理和静音所有告警,允许您轻松整合和集中所有告警(部分功能开发中)。
  • 多维度数据查询支持跨数据源查询、数据源重命名、汇总、组合和执行计算。
  • 自建数据源支持打通同地域多个 VPC 或添加多个 VPC 中的数据源到同一个工作区,支持统一查询展示与告警。
  • 面板编辑器通过一致的UI轻松配置、自定义和浏览所有面板,以便跨所有可视化面板设置数据选项。


b0445306b7af40c5912ffaaee55f8ee0.png

  希望通过 Grafana 托管服务,可以为各位开发者解决在使用 Grafana 时遇到的各种痛点,并获得更便捷的使用体验。也希望各位同学能够提出宝贵的建议,以便让 Grafana 托管服务走得更远。欢迎加入 Grafana 社群,钉钉扫码或搜索「34785590」即可入群!


45f0462682f44b7abcf6437ad6950b92.jpg


点击下方链接👇,立即申请服务!

https://survey.aliyun.com/apps/zhiliao/vJytm8_sj?spm=5176.24855332.J_9932635580.2.4a633d1bQzGm1l

相关实践学习
通过可观测可视化Grafana版进行数据可视化展示与分析
使用可观测可视化Grafana版进行数据可视化展示与分析。
相关文章
|
3月前
|
容器 云栖大会
|
存储 大数据 Serverless
限时领票|走进 2023 · 云栖大会,看大咖对话开源
2023 云栖大会来啦,大数据与数据分析、开源技术等众多主题活动与你同聚,门票免费领取中,数量有限,先到先得!
372 0
限时领票|走进 2023 · 云栖大会,看大咖对话开源
|
存储 SQL 运维
云栖大会开源重磅升级![版本更新]PolarDB-X v2.2: 企业级和国产ARM适配
PolarDB-X 正式发布2.2.0版本,这是一个重要的里程碑版本,重点推出符合分布式数据库金融标准下的企业级和国产ARM适配,共包括八大核心特性,全面提升 PolarDB-X 分布式数据库在金融、通讯、政务等行业的普适性。
|
人工智能 大数据 云栖大会
|
Cloud Native 安全 Linux
议程剧透!1个主论坛4场Workshop,龙蜥操作系统峰会盛大来袭 | 2022 云栖大会
每场 Workshop 开放 30 个报名名额,人人一份龙蜥伴手礼!先报先审!
议程剧透!1个主论坛4场Workshop,龙蜥操作系统峰会盛大来袭 | 2022 云栖大会
|
消息中间件 Dubbo Kafka
云栖大会 | 开源引力峰会线下参会指南
在各种纷乱的信号与噪声中,阿里是如何在商业成功和以开源为代表的工程师文化中平衡?我们该如何理解开源和商业的关系、云厂商和开源项目的关系?
605 0
云栖大会 | 开源引力峰会线下参会指南
|
1月前
|
存储 人工智能 弹性计算
阿里云弹性计算_加速计算专场精华概览 | 2024云栖大会回顾
2024年9月19-21日,2024云栖大会在杭州云栖小镇举行,阿里云智能集团资深技术专家、异构计算产品技术负责人王超等多位产品、技术专家,共同带来了题为《AI Infra的前沿技术与应用实践》的专场session。本次专场重点介绍了阿里云AI Infra 产品架构与技术能力,及用户如何使用阿里云灵骏产品进行AI大模型开发、训练和应用。围绕当下大模型训练和推理的技术难点,专家们分享了如何在阿里云上实现稳定、高效、经济的大模型训练,并通过多个客户案例展示了云上大模型训练的显著优势。
104598 10
|
2月前
|
存储 弹性计算 人工智能
阿里云弹性计算_通用计算专场精华概览 | 2024云栖大会回顾
阿里云弹性计算产品线、存储产品线产品负责人Alex Chen(陈起鲲)及团队内多位专家,和中国电子技术标准化研究院云计算标准负责人陈行、北京望石智慧科技有限公司首席架构师王晓满两位嘉宾,一同带来了题为《通用计算新品发布与行业实践》的专场Session。本次专场内容包括阿里云弹性计算全新发布的产品家族、阿里云第 9 代 ECS 企业级实例、CIPU 2.0技术解读、E-HPC+超算融合、倚天云原生算力解析等内容,并发布了国内首个云超算国家标准。
阿里云弹性计算_通用计算专场精华概览 | 2024云栖大会回顾
|
2月前
|
存储 弹性计算 安全
阿里云弹性计算_通用计算专场精华概览 | 2024云栖大会回顾
本次专场内容包括阿里云弹性计算全新发布的产品家族、阿里云第9代 ECS 企业级实例、CIPU 2.0技术解读、E-HPC+超算融合、倚天云原生算力解析等内容,并发布了国内首个云超算国家标准。

相关产品

  • 可观测可视化 Grafana 版