通勤路上修故障?钉钉机器人+ OOS AI 助手实现 7×24 小时运维自由

简介: 通过钉钉机器人配置阿里云 OOS AI 助手,您可以直接在钉钉群内发送文字指令,实现免登录、跨设备、秒级响应的阿里云运维操作。

【阅读原文】戳:通勤路上修故障?钉钉机器人+ OOS AI 助手实现 7×24 小时运维自由

一、背景:移动时代的运维挑战

 

在传统运维场景中,工程师往往依赖电脑登录控制台完成资源管理。然而,突发故障可能发生在任何场景——会议中、通勤路上,甚至深夜家中。此时若无法及时响应,可能导致业务中断、客户投诉,甚至经济损失。

 

痛点场景:

  • 设备限制:电脑未随身携带,无法登录控制台。
  • 响应延迟:需等待同事协助或寻找临时设备,耗时数分钟至数小时。  
  • 操作复杂:通过手机浏览器登录控制台,界面受限且操作繁琐。

 

解决方案:

阿里云系统运维管理 OOS AI 助手是一款基于自然语言交互的智能运维工具,通过文字指令即可完成云资源查询、监控等操作。通过钉钉机器人配置阿里云 OOS AI 助手,您可直接在钉钉群内发送文字指令,实现免登录、跨设备、秒级响应的运维操作。

 

 

二、实战案例:深夜故障的 10 分钟逆袭

 

时间:凌晨 1:23

地点:运维工程师张伟的家中

 

张伟的手机突然震动,钉钉群弹出一条告警通知:

 

【阿里云监控】北京 ECS 内存使用率 98 %,持续 5 分钟

 

他翻身起床,却发现电脑落在公司。情急之下,他打开钉钉群,@AI 助手发送指令:  

 

“重启北京 ECS 实例 i-******* ”  

 

机器人返回确认弹窗:

 

“即将调用 ECS RestartInstance API 重启实例 i-******* ,确认执行?(Y/N)”

 

张伟输入“Y”,扩容操作自动完成。5 分钟后,监控显示内存使用率回落至 30%,业务恢复。他长舒一口气,继续入睡。  

 

次日晨会,主管问:“昨晚怎么这么快恢复的?”

 

张伟笑答:“有了钉钉机器人,运维终于不再‘看电脑脸色’。”  

 

 

三、如何使用 OOS AI 助手

 

1. 通过阿里云系统运维管理(OOS)控制台快速体验

 

a. 登录阿里云系统运维管理控制台 [1],在右侧菜单栏找到“OOS AI 助手”,点击后启用“OOS AI 助手”。

 

image.png

 

image.png

 

b. 点击预设问题或直接输入您的需求与“OOS AI 助手”进行对话。

 

image.png

 

2. 将 OOS AI 助手集成到钉钉机器人

 

您可以参考“四、配置步骤”进行配置,将 OOS AI 助手集成到钉钉机器人使用,通过此方式使用具有如下优势:

 

  • 免登录操作:

无需登录控制台,直接通过钉钉群完成资源查询、监控、操作。

  • 应急响应无死角:

突发故障时,即使电脑不在身边,也能通过手机端快速处理。

  • 权限分级管控:

支持 RAM 角色绑定,按需分配群成员可执行的指令范围(如仅允许“运维组”执行扩容)。

  • 告警联动自动化:

云监控告警自动推送至钉钉群,可根据监控情况对云资源进行运维操作。

 

 

四、配置步骤

 

方案概览

 

在钉钉中添加一个 AI 机器人,只需几步:

 

  • 创建钉钉应用:创建一个钉钉应用,在您的钉钉组织中提供机器人问答服务。
  • 在 OOS 创建机器人聊天配置:在 OOS 创建聊天配置信息,OOS 会自动创建阿里云 AppFlow 连接流 [2],AppFlow 连接流可以实现钉钉机器人和阿里云 OOS AI 助手的关联,最终实现在钉钉聊天中访问 OOS AI 助手。
  • 配置钉钉机器人:为钉钉应用配置机器人,添加到群聊中可以访问您的阿里云资源。

 

 

1. 创建钉钉应用

 

接下来您需要在您的组织中创建钉钉应用,作为 AI 助手回答用户问题。

 

重要:

创建钉钉应用需要您的钉钉账号有开发者权限。您可以联系您的组织管理员获取钉钉开放平台的开发权限,具体操作请参见获取开发者权限 [3]

 

1.1 创建应用

 

a. 访问钉钉开放平台 [4],点击创建。如果创建过应用未展示应用开发指引,点击立即开始进入钉钉应用页面。

 

image.png

 

b. 在应用开发的左侧导航栏中,点击钉钉应用,在钉钉应用页面右上角点击创建应用

 

image.png

 

c. 在创建应用面板,填写应用名称应用描述,上传应用图标,完成后点击保存

 

image.png

 

1.2 查看应用 Client ID 和 Client Secret

 

在左侧菜单选择凭证与基础信息,复制 Client IDClient Secret,用于下一步创建连接流。

 

image.png

 

1.3 创建消息卡片

 

钉钉机器人通过卡片消息支持流式返回结果,您需要创建卡片模板供消息发送使用。

 

a. 访问卡片平台 [5],点击新建模板

 

image.png

 

b. 在创建模板输入框,填入模板信息。

 

image.png

 

c. 在模拟编辑页面,保存发布模板。然后点击返回模板列表页面。

 

image.png

 

d. 复制模板 ID,用于创建钉钉连接流使用。

 

image.png

 

1.4 授予应用发送卡片消息权限

 

创建卡片后,您需要给应用授予发送卡片消息的权限。

 

a. 访问钉钉应用列表 [6]。找到刚刚创建的应用,点击应用名称进入详情页面。

b. 在左侧菜单选择开发配置 > 权限管理,在左侧搜索框分别输入 Card.Streaming.Write 和 Card.Instance.Write,并在操作列点击申请权限

 

image.png

 

 

2. 在 OOS 创建机器人聊天配置

 

您可以在系统运维管理控制台 ChatOps 配置页面 [7],根据上述钉钉配置信息创建 OOS ChatOps 配置。OOS 会自动帮您创建一个 AppFlow 连接流 [8],AppFlow 连接流可以将 OOS AI 助手和钉钉连接起来。

 

a. 在系统运维管理控制台 ChatOps 配置页面 [7]点击创建配置,填写配置名称,类型选择“钉钉(DingTalk)”, 填入之前获取到的钉钉应用的 Client ID、Client Secret 和卡片模板 ID, 选择授信给 OOS的服务角色(为 OOS 服务设置 RAM 角色并授权 [9]),点击创建。

 

image.png

 

b. 创建完成后查看详情,找到 WebhookUrl 并复制。

 

image.png

 

 

3. 配置钉钉机器人

 

有了 webhook 地址后,接下来您可以在钉钉应用中配置机器人来访问您的云资源了。

 

3.1 配置钉钉机器人

 

a. 访问钉钉应用列表 [6]。找到刚刚创建的应用,点击应用名称进入详情页面。

b. 在添加应用能力页面,找到机器人卡片,点击添加

 

image.png

 

在机器人配置页面,打开机器人配置开关,您可以参考下图完成配置。消息接收模式请选择 HTTP 模式消息接收地址为刚刚的 WebhookUrl。然后点击发布

 

重要:

消息接收模式请选择 HTTP 模式,目前 AppFlow 仅支持 HTTP 模式,选择 Stream 模式会导致无法返回消息。

 

image.png

 

3.2 发布应用版本

 

应用创建完成后,如果需要将应用供企业内其他用户使用,需要发布一个版本。

 

a. 点击应用开发,在钉钉应用页面,点击目标应用(智能运维服务)。

 

image.png

 

b. 在目标应用开发导航栏,点击版本管理与发布,在版本管理与发布页面,点击创建新版本。进入版本详情页面,输入应用版本号版本描述信息,选择合适的应用可见范围,完成后点击保存。并在弹窗中点击直接发布

 

image.png

 

3.3 测试机器人

 

你可以创建群聊或在已有群聊中添加机器人,并与机器人对话,查看效果。

 

a. 在钉钉群管理中添加机器人。进入钉钉群设置页面,点击机器人卡片区域,在机器人管理页面,点击添加机器人。在添加机器人搜索文本框中输入目标机器人名称,并选中要添加的机器人。点击添加,完成后再点击完成添加

 

image.png

 

b. 在钉钉群中或私聊时@机器人,进行交流互动。

 

在钉钉群发送指令:

 

@AI助手 杭州运行中的ecs实例信息

 

机器人返回:自动调用阿里云 OpenAPI 完成实例信息查询。

 

image.png

 

根据查询的信息继续追问(此时不需要再输入地域和产品信息,AI 助手会根据上次对话的内容自动填充相关信息):

 

@AI助手 查看 i-bp1j******5da 10分钟内cpu使用情况

 

image.png image.png

 

机器人返回:带有折线图的监控信息。

 

 

五、适用场景与价值

 

image.png

 

 

六、注意事项

 

1. 权限最小化原则:  

为 RAM 角色分配最小必要权限(如实习生组仅允许查询)。

 

2. 敏感操作二次确认:

所有写操作(如删除、扩容)默认触发二次确认,防止误触。

通过钉钉机器人与 OOS AI 助手的结合,企业可真正实现“随时随地运维”,让故障响应不再受设备与场景限制,为业务稳定性保驾护航。

 

使用过程中有任何问题,可以加钉钉群反馈:

image.png

 

相关链接:

 

[1] 阿里云系统运维管理控制台

https://account.aliyun.com/login/login.htm?oauth_callback=https%3A%2F%2Foos.console.aliyun.com%2Foverview&clearRedirectCookie=1&lang=zh

 

[2] 阿里云 AppFlow 连接流

https://help.aliyun.com/zh/compute-nest/create-a-connection-flow

 

[3] 获取开发者权限

https://open.dingtalk.com/document/orgapp/obtain-developer-permissions

 

[4] 钉钉开放平台

https://login.dingtalk.com/oauth2/challenge.htm?redirect_uri=https%3A%2F%2Fopen-dev.dingtalk.com%2Fdingtalk_sso_call_back%3Fcontinue%3Dhttps%253A%252F%252Fopen-dev.dingtalk.com%252F&response_type=code&client_id=dingbakuoyxavyp5ruxw&scope=openid+corpid

 

[5] 卡片平台

https://login.dingtalk.com/oauth2/challenge.htm?redirect_uri=https%3A%2F%2Fopen-dev.dingtalk.com%2Fdingtalk_sso_call_back%3Fcontinue%3Dhttps%253A%252F%252Fopen-dev.dingtalk.com%252Ffe%252Fcard&response_type=code&client_id=dingbakuoyxavyp5ruxw&scope=openid+corpid

 

[6] 钉钉应用列表

https://login.dingtalk.com/oauth2/challenge.htm?redirect_uri=https%3A%2F%2Fopen-dev.dingtalk.com%2Fdingtalk_sso_call_back%3Fcontinue%3Dhttps%253A%252F%252Fopen-dev.dingtalk.com%252Ffe%252Fapp&response_type=code&client_id=dingbakuoyxavyp5ruxw&scope=openid+corpid

 

[7] 系统运维管理控制台 ChatOps 配置页面

https://account.aliyun.com/login/login.htm?oauth_callback=https%3A%2F%2Foos.console.aliyun.com%2Fcn-hangzhou%2FchatOps&clearRedirectCookie=1&lang=zh

 

[8] AppFlow 连接流

https://help.aliyun.com/zh/compute-nest/create-a-connection-flow

 

[9] 为 OOS 服务设置 RAM 角色并授权

https://help.aliyun.com/zh/oos/use-cases/grant-ram-permissions-on-oos

 


我们是阿里巴巴云计算和大数据技术幕后的核心技术输出者。

欢迎关注 “阿里云基础设施”同名微信微博知乎

获取关于我们的更多信息~

目录
打赏
0
25
23
0
275
分享
相关文章
聚焦“AI+运维”深度融合,龙蜥系统运维联盟 MeetUp 圆满结束
现场 40 多位开发者进行了深入的技术交流,探索 AI 与运维深度融合的未来路径。
AI驱动的智能设备健康评估系统究竟如何应对企业运维挑战?
AI驱动的智能设备健康评估系统通过人工智能技术实现设备状态的主动监测和预测性维护。该系统由Prompt规则库、评估任务触发机制、Agent执行等核心组件构成,能够自动获取数据、智能分析设备状态并生成可视化报告。相比传统运维方式,系统具有规则灵活定义、低成本集成、高阶智能分析等优势,适用于能耗监测、异常检测、预测性维护等多种工业场景。产品专家三桥君通过详细解析系统工作流程和实际案例,展示了如何帮助企业实现从"事后维护"到"预测性运维"的智能化转型。
57 0
7月27日云栖精选夜读:AI时代,运维和测试岗位如何开启"第二春"?
面临一个个利好消息:devops、开发自运维、持续集成、开发自测试、自动化测试,机器人吃人的时代不远了。作为运维,作为测试,在成为瓶颈甚至障碍绊脚石之前,如何开启职业的“第二春”?
3795 0
GPT为定制AI应用工程师转型第一周学习计划
本计划帮助开发者快速入门AI领域,首周涵盖AI基础理论、Python编程及PyTorch实战。前两天学习机器学习、深度学习与Transformer核心概念,掌握LLM工作原理。第三至四天快速掌握Python语法与Jupyter使用,完成基础编程任务。第五至七天学习PyTorch,动手训练MNIST手写识别模型,理解Tensor操作与神经网络构建。
48 0
BISHENG下一代企业AI应用的“全能型“LLM软件
杭州奥零数据科技有限公司成立于2023年,专注于数据中台业务,维护开源项目AllData并提供商业版解决方案。AllData提供数据集成、存储、开发、治理及BI展示等一站式服务,支持AI大模型应用,助力企业高效利用数据价值。
附部署代码|云数据库RDS 全托管 Supabase服务:小白轻松搞定开发AI应用!
本文通过一个 Agentic RAG 应用的完整构建流程,展示了如何借助 RDS Supabase 快速搭建具备知识处理与智能决策能力的 AI 应用,展示从数据准备到应用部署的全流程,相较于传统开发模式效率大幅提升。
附部署代码|云数据库RDS 全托管 Supabase服务:小白轻松搞定开发AI应用
本文通过一个 Agentic RAG 应用的完整构建流程,展示了如何借助 RDS Supabase 快速搭建具备知识处理与智能决策能力的 AI 应用,展示从数据准备到应用部署的全流程,相较于传统开发模式效率大幅提升。
附部署代码|云数据库RDS 全托管 Supabase服务:小白轻松搞定开发AI应用
3个月,上百家企业交流,和大家聊聊AI应用的落地实践(开篇)
企业希望自己的业务被 AI 赋能的诉求是强烈的,但大多数企业是不知道从哪里下手的
【保姆级教程】Dify+DeepSeek+MCP三件套:零门槛打造AI应用流水线,手把手实战教学!
本教程手把手教你用Dify+DeepSeek+MCP三件套零门槛搭建AI应用流水线:Dify提供可视化工作流编排,DeepSeek贡献128K长文本国产最强模型,MCP实现弹性部署。这套组合兼具低代码开发、高性能推理和灵活运维三大优势,助你快速落地企业级AI解决方案。

热门文章

最新文章

下一篇
BFE 初探
AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等

登录插画

登录以查看您的控制台资源

管理云资源
状态一览
快捷访问