阿里云百炼CLI是什么?bailian-cli是一个命令行工具,用于在终端环境中调用阿里云ai大模型服务平台百炼的各项能力。百炼CLI采用插件化设计,可被集成到支持 Skill 机制的 AI Agent 客户端(如 Cursor、Qoder 等)中,使这些智能体能够通过自然语言指令自动执行百炼平台上的任务,例如生成图片、视频、调用插件或操作云资源。阿里云百炼CLI官网介绍:https://bailian.console.aliyun.com/cli

一行指令:在你的 Agent 中调用百炼 CLI 能力
只需在支持 Skill 的 Agent(如 Cursor 或 Qoder)对话中输入以下任一自然语言指令,即可触发百炼 CLI 的调用:
帮我生成 6 张亚马逊电商主图,产品是白色无线蓝牙耳机。
或
帮我生成一段 30 秒的白色无线蓝牙耳机产品演示视频。
前提条件:
- 已全局安装百炼 CLI:
npm install -g bailian-cli;- 已在百炼控制台获取 API Key 并通过指令配置:
配置我的 API Key 是:sk-xxxxxxxxxxxxx- Agent 客户端已加载
bailian-cliSkill(通常安装后自动注册至~/.cursor/skills/bailian-cli/或~/.qoder/skills/bailian-cli/)。
兼容主流 AI Agent 框架
阿里云百炼 CLI兼容主流 Agentic 框架,接入即可调用图像、视频、语音、知识库等 10+ 项原子能力。例如:Cursor、OpenClaw、Claude Code及Cline等。开通阿里云百炼:https://www.aliyun.com/product/bailian 先免费领取千万Tokens:

阿里云百炼 CLI支持能力清单
让您的 AI Agent 开箱就具备以下能力,并可在复杂任务中自动组合调用,如下图:

- 文本生成 qwen3.7-max 面向智能体时代的旗舰 Max 模型,编程、办公与长周期自主执行能力出色
- 视觉理解 qwen3-vl-plus 思考/非思考双模式融合,视觉 coding、空间感知与超长视频理解全面升级
- 语音生成 cosyvoice-v3-flash 多音色实时流式合成,自然度/情感增强,5-20s 样本即可克隆
- 语音识别 fun-asr 汉语七大方言 + 20+ 口音官话,覆盖 30 种语种
- 全模态能力 qwen3.5-omni-plus 文本/图像/音频/音视频理解与交互,支持 10h 音频与 400s 音视频
- 图像生成 qwen-image-2.0 图片生成与编辑融合,专业文字渲染、真实质感、强语义遵循
- 图像编辑 qwen-image-2.0 智能编辑,支持多图合成
- 图生视频 happyhorse-1.0-i2v 精准理解文本语义,输出流畅自然的高质量视频
- 文生视频 happyhorse-1.0-t2v 高度还原动态画面,细节丰富
- 参考生视频 happyhorse-1.0-r2v 支持最多 9 张图片参考,稳定主体与场景保持
- 视频编辑 happyhorse-1.0-video-edit 自然语言指令编辑视频,支持最多 5 张图片参考
- 知识库 阿里云百炼知识库 多模态数据知识库增删改查检索,需 AccessKey 认证
- 记忆库 阿里云百炼记忆库 跨会话持久化存储,提供个性化连贯对话体验
- 工作流调用 工作流服务 调用已有的工作流应用服务
- 智能体调用 智能体服务 调用已有的智能体应用服务
- 联网搜索 bailian_web_search 实时互联网全栈信息检索,提升回答准确性及时效性
- 临时文件上传 临时文件上传服务 免费临时存储空间,上传本地文件获得 URL(有效期 48 小时)
- 模型额度查询 模型额度查询 根据模型id查询可以使用的免费额度
- 接口文档 阿里云百炼模型应用API调用参考文档 在构建应用的过程中,自动为您的应用集成阿里云百炼模型和应用能力API
技术原理简述
当 Agent 接收到上述自然语言指令后,会:
- 匹配已注册的
bailian-cliSkill; - 解析用户意图并构造对应的 CLI 命令;
- 在后台调用
bailian-cli工具,传入参数并通过百炼 API 执行任务; - 将结果返回给用户。
该机制使得开发者无需编写代码,仅通过对话即可驱动百炼平台完成复杂 AI 任务。