智能运维+多模型服务能力,阿里云 RDS AI 助手旗舰版正式上线!

本文涉及的产品
RDS MySQL DuckDB 分析主实例,集群系列 4核8GB
PolarDB Agent Express,2核4GB
RDS MySQL DuckDB 分析主实例,基础系列 4核8GB
简介: RDS AI 助手旗舰版在 RDS AI 助手专业版智能运维能力的基础上,提供灵活模型选择、智能模型路由、多模型灾备、API Key 集成等更自主可控、灵活便捷的模型服务,并支持纳管运维各类环境部署的数据库。

数据库运维团队常常面临两大难题:一是混杂在阿里云、自建和他云上的各类数据库难以统一管理;二是想利用大模型能力提升运维效率,却要分别对接多个厂商的 API、管理多套密钥、承担高昂的集成成本。

RDS AI 助手旗舰版在 RDS AI 助手专业版智能运维能力的基础上,提供灵活模型选择、智能模型路由、多模型灾备、API Key 集成等更自主可控、灵活便捷的模型服务,并支持纳管运维各类环境部署的数据库。

一、功能介绍

智能运维能力

旗舰版包含 RDS AI 助手专业版的全部智能运维能力,并扩展支持自建数据库和其他云数据库的运维场景。核心智能运维能力包括:

  • 智能问答:通过自然语言查询数据库性能、资源用量和实例信息,例如查询CPU使用率最高的实例、分析慢SQL原因、筛选异常实例等,无需手动逐个查看监控面板。
  • 智能诊断:深度集成到数据库运维各环节,提供错误日志解读、慢日志分析、参数配置排查、性能异常诊断等能力。支持批量实例巡检,自动分析实例状态、资源使用、慢查询、备份恢复、高可用、安全配置等12个维度60余项检查项,生成结构化诊断报告。
  • 个性化Agent定制:支持创建自定义AI助手,配置专属角色、知识库和响应逻辑。可以适配企业特定术语、命名规范和审批流程,也可以配置日常巡检自动化任务(如每日慢 SQL 报告、每周合规检查等)。

相比专业版仅支持阿里云 RDS 实例,旗舰版可通过 API Key 将上述智能运维能力集成到您的自有运维系统中,统一管理阿里云 RDS、自建数据库和其他云环境的数据库实例。

多模型服务能力

除智能运维外,旗舰版还提供灵活的多模型调用服务,是旗舰版区别于专业版的核心增量能力。相比自行采购大模型 API,RDS AI 助手旗舰版具备以下核心优势:

  • 混合模型架构:整合百炼平台模型、RDS 自部署模型等多种模型来源,一个 API Key 即可调用通义千问、智谱、Kimi、MiniMax 等多家主流大模型,无需分别注册和管理多个平台的账号与密钥
  • 模型智能调度:系统根据任务复杂度和 Token 成本自动选择最优模型(如简单查询用qwen-flash,常规任务用qwen3.5-plus,复杂推理用qwen3-max),帮助您在效果与成本之间取得最佳平衡。
  • AI原生产品力:基于云原生 AI 网关构建,提供企业级能力保障:
  • 运维扩展性:支持自建数据库。
  • 安全性:API Key 管理、内容安全防护、敏感数据脱敏。
  • 稳定性:支持熔断降级、自动重试、多模型灾备,保障服务高可用。
  • 可观测:内置 Token 计量、成本分析和实时监控,支持精细化运营。
  • 性能:低延迟转发、高并发支持、流式输出优化。

二、费用说明

智算包规格

  • 计费方式:通过购买“智算包”获取 Token 额度,按月预付费。
  • 规格与额度:智算包提供S、M、L、XL、2XL、4XL六种规格,购买多个同规格智算包将叠加 Token 额度(如购买2个S规格智算包,将获得2×5亿=10亿的Token额度)。

image.png

说明:智算包内的Token额度可同时抵扣模型的输入Tokens和输出Tokens消耗,无需分别购买。

M、L、XL、2XL、4XL规格智算包每月额外赠送基准Tokens额度,分别为0.1亿、0.6亿、2.5亿、5亿、10亿,与购买的Token额度合并使用。

模型消耗系数

旗舰版支持qwen3-max、qwen3.5-plus等大模型。不同模型调用时消耗的Token量不同,通过消耗系数折算扣减。系数分为输入Tokens消耗系数输出Tokens消耗系数,例如qwen3.5-plus模型输入系数为5.3,则每输入1个Token实际扣减5.3个Token额度;输出系数为31.8,则每输出1个Token实际扣减31.8个Token额度。


下表展示常用模型的消耗系数,包含对话生成模型、向量模型与重排模型。完整模型列表及最新系数请以控制台显示为准。

模型

输入Tokens消耗系数

输出Tokens消耗系数

适用场景

qwen-flash

1

10

高频简单查询、快速响应场景

qwen3-max

16.5

66

复杂推理、根因分析、SQL优化

qwen3.5-plus

5.3

31.8

通用对话、日常问题解答

qwen3-rerank

3.33

检索结果重排序、相关性精排

text-embedding-v4

3.33

文本向量化、语义检索、RAG场景

上下文缓存

旗舰版支持模型服务上下文缓存功能。当多次请求包含相同的输入内容(如系统提示词、历史对话)时,命中缓存的部分按更低的系数计费,可有效降低重复请求的 Token 消耗。

  • 生效范围:缓存仅对输入Tokens生效,输出 Tokens 不受影响。
  • 计费系数:当请求命中缓存时,命中部分的 Token 数量(cache_token)按0.2 折扣系数计算等效输入 Tokens,再乘以模型的输入Tokens消耗系数得到实际扣减的 Token额度。即:实际扣减 = 命中Token数 × 0.2 × 模型输入系数。以qwen3.5-plus(输入系数为5.3)为例,单次请求输入1,000个 Token、其中600个命中缓存,实际扣减 Token额度计算如下:
  • 命中缓存部分(600 Tokens):600 × 0.2 × 5.3 = 636 Token额度
  • 未命中部分(400 Tokens):400 × 5.3 = 2,120 Token额度
  • 本次输入合计扣减:636 + 2,120 = 2,756 Token额度(相比未启用缓存的 5,300 节省约 48%)

三、开通方式

购买智算包即开通RDS AI助手旗舰版。(目前旗舰版需申请加白后跟随下面步骤进行开通:点此申请加白

  1. 访问RDS管理控制台,在左侧导航栏选择 RDS AI 助手 > 旗舰版,单击立即开通。
  2. 在RDS AI助手购买页配置以下参数:
  • 智算包规格:根据业务规模选择合适的智算包规格(S/M/L/XL/2XL/4XL)。各规格的 Token 额度和价格请参见智算包规格
  • 购买数量:选择智算包的购买数量。购买多个同规格智算包时,Token额度按倍数叠加。例如购买2个S规格智算包,将获得2×5亿=10亿的Token额度。
  • 购买时长:选择智算包的购买时长,支持按月购买。
  1. 单击立即购买,完成支付后即开通旗舰版。您可以在 RDS AI 助手 > 旗舰版页面查看实例详情。

四、API Key管理

获取API Key

开通旗舰版后,您需要获取API Key来调用大模型服务。

  1. 访问RDS管理控制台,在左侧导航栏选择RDS AI助手 > 旗舰版,进入旗舰版详情页面。
  2. 在API Key区域,单击复制按钮进行API Key复制。

警告API Key是访问大模型服务的凭证,请勿对外泄露或在公开代码中硬编码。如果API Key泄露,请立即重新生成。

  1. 在API Key区域查看Base URL,根据您的应用场景选择对应格式的URL接入模型服务。Base URL兼容OpenAI和Anthropic两种接口协议,您可以根据使用的工具或SDK选择对应的URL。

说明Base URL为每个用户动态生成,不同用户的URL可能不同,请以控制台实际显示为准。

API Key配置

旗舰版支持配置多个 API Key,实现不同业务场景的隔离管理和独立限额控制。

主API Key(System Key)

开通旗舰版后,系统自动生成一个主 API Key,拥有当前实例的全部 Token 用量限额。

子API Key(Custom Key)

您可以创建多个自定义 API Key,系统将 Token 额度按均分比例分配给各个 API Key。每个 API Key 独立限流,同时受整体限流约束。支持以下操作:

  • 创建API Key:生成新的自定义 API Key,自动按均分比例分配 Token 限额。
  • 删除API Key:删除不再使用的自定义 API Key,释放对应的限额分配。
  • 重置API Key:重新生成 API Key 的密钥值,原密钥立即失效。

API 调用示例图:


重要:若主 API Key 存在活跃的模型请求调用,分配出的自定义 API Key 可能无法用满其分配的限额。

五、立即开始

开通体验:点此申请加白

了解更多:RDS AI 助手旗舰版帮助文档

相关文章
|
2月前
|
数据采集 机器学习/深度学习 人工智能
Agent 构建变轻、Agent 架构变薄,什么正在变厚?
群体智能已在从实验走向应用,从另一维度推动 Agent Team 的共鸣。
436 22
|
1月前
|
存储 自然语言处理 NoSQL
阿里云知识存储 Skill 上架阿里云官网首批 Agent Skill:让智能体拥有企业级知识库
Tablestore 推出 Serverless 知识库 Skill,一站式解决 RAG 落地难题:告别繁琐选型部署,支持自然语言对话式创建与检索;混合向量 + 全文检索、弹性伸缩、零门槛集成,让百万级企业知识秒变 Agent “超能力”。
681 0
|
2月前
|
存储 人工智能 开发者
AI Agent 越来越难迭代,你缺少的不是功能
还在担心 Token 消耗过多?还在纠结 Agent 难以优化?不改一行业务代码,LoongSuite Python 探针帮你把一次请求从头到尾捋顺:哪一步访问了什么模型、调用了什么工具、召回了哪些文档、花费了多少 token、上下文发生了什么变化。
287 46
|
1月前
|
SQL 关系型数据库 MySQL
【MySQL百日打怪升级第14天】 LIMIT 分页的性能优化:深分页到底慢在哪?
本文深入剖析MySQL深分页(如`LIMIT 100000,20`)性能瓶颈:本质是OFFSET导致全量扫描与丢弃,页码越深,扫描行数线性增长。详解三种实战优化方案——游标分页(高效稳定,需有序唯一字段)、延迟关联(兼容OFFSET,索引覆盖减回表)、范围分页(极简但场景受限),并附EXPLAIN对比与避坑指南。(239字)
226 6
|
2月前
|
SQL 关系型数据库 MySQL
EXPLAIN 执行计划:一眼看穿你的SQL慢在哪
数据库小学妹带你轻松掌握SQL性能诊断!通过EXPLAIN查看执行计划,精准识别索引失效、全表扫描(ALL)、key为NULL等瓶颈。聚焦type、key、rows等6个关键字段,结合实战案例与避坑指南(如函数滥用、最左前缀破坏),让优化有的放矢。学完即用,告别盲目调优!
|
1月前
|
存储 人工智能 监控
Nacos Skill Registry:面向个人场景的 Skill 中心实践
构建个人 Skill 技能中心,实现多 Agent 复用与协作。
332 25
|
1月前
|
存储 运维 NoSQL
你的企业知识库,何必自己折腾?Tablestore 知识库服务帮你一站式搞定
Tablestore 知识库服务是阿里云推出的全托管 RAG 解决方案,基于 Serverless 架构,支持文档自动解析、向量化、混合检索与Subspace多租户隔离;数据全程留存客户OSS/Tablestore账户,零运维、按量付费,满足金融、政务等高合规场景需求。
681 124
|
2月前
|
人工智能 供应链 安全
AI 开源库遭投毒事件的启示,和阿里云 AI 网关的回答
以LiteLLM投毒事件为鉴,解析阿里云AI网关的架构级安全防护。
519 36
|
1月前
|
存储 弹性计算 数据库
阿里云优惠券是什么?优惠券在哪领取?领取后在哪查询?怎么使用?一文看懂~
阿里云优惠券是抵扣云产品费用的权益,含代金券、满减券、折扣券三类。学生可领300元无门槛券;个人/企业可在权益中心:https://t.aliyun.com/U/0QpP7a 免费领取;查询使用均在【费用与成本→卡券】页面,结算时自动匹配或手动选择。
152 4
|
1月前
|
人工智能 运维 安全
让 AI 帮你运维 Elasticsearch:阿里云 ES Agent Skill 正式发布
阿里云Elasticsearch Agent Skill是一套面向AI编程助手的智能运维技能包,覆盖实例创建、故障诊断、网络配置三大核心场景。支持自然语言交互,自动校验参数、识别架构差异、执行幂等操作,并内置49条诊断规则与7套SOP,大幅提升ES运维效率与可靠性。
593 7