阿里云百炼 CLI 接入 AI Agent 教程:图像 / 视频 / 语音能力调用说明

简介: 阿里云百炼CLI是百炼AI平台推出的命令行工具,支持一键调用图像、视频、语音、知识库等10+原子能力。提供AI Agent自动安装与手动安装两种方式,兼容CURSOR、Claude Code等主流框架,助力高效构建AI应用。阿里云百炼官网:https://t.aliyun.com/U/fPVHqY

阿里云百炼 CLI 接入 AI Agent 教程:图像 / 视频 / 语音能力调用说明,阿里云百炼CLI指南:命令行工具接入AI Agent部署安装教程及使用全解析,阿里云百炼CLI是百炼AI大模型平台推出的命令行工具,一行指令让AI Agent自动调度多项模型应用能力,阿小云分享百炼CLI命令行工具安装教程、支持功能及使用教程,在阿里云Club中心免费领取优惠券。


阿里云百炼CLI指南

什么是CLI?CLI全名Alibaba Cloud CLI,阿里云百炼跨平台命令行工具,CLI可用于管理阿里云资源,用户可以在终端中完成控制台的几乎所有操作,并将命令组合为脚本实现自动化运维。阿里云百炼CLI官网:https://bailian.console.aliyun.com/cli

百炼CLI安装教程

百炼CLI命令行工具有两种安装方式可以选择AI Agent安装,也可以选择手动安装,教程如下:

方法1:AI Agent安装CLI教程

1、告诉你的AI Agent:

请阅读:https://bailian.aliyun.com/cli/install.md 并按照说明为我安装阿里云百炼 CLI

2、前往阿里云百炼控制台获取API Key,告诉Agent:

配置我的 API Key 是:sk-xxxxxxxxxxxx

3、开始使用:

帮我生成一套亚马逊电商主图,6 张图,产品是纯黑色夏日男装 T 恤

方法2:手动安装CLI教程

1、安装 CLI 和配套 skills:

npm install -g bailian-cli && npx skills add modelstudioai/cli --all -g

2、前往阿里云百炼控制台获取API Key,执行以下命令完成认证:

bl auth login --api-key YOUR_API_KEY

3、开始使用

bl image generate --prompt "纯黑色夏日男装T恤产品主图"

CLI兼容主流AI Agent框架

百炼CLI命令行工具兼容主流AI Agent框架,兼容主流Agentic框架,接入即可调用图像、视频、语音、知识库等10+项原子能力,如:CURSOR、OpenClaw、Claude Code、Codex、Qoder、Qwen Code、Kilo Code、Cline、OPENCODE,如下图:


百炼CLI让AI Agent支持功能

阿里云百炼CLI命令行工具让你的AI Agent开箱就具备以下能力,并可在复杂任务中自动组合调用,如下图:


模型服务

能力 默认服务 简介
文本生成 qwen3.7-max 面向智能体时代的旗舰 Max 模型,编程、办公与长周期自主执行能力出色
视觉理解 qwen3-vl-plus 思考/非思考双模式融合,视觉 coding、空间感知与超长视频理解全面升级
语音生成 cosyvoice-v3-flash 多音色实时流式合成,自然度/情感增强,5-20s 样本即可克隆
语音识别 fun-asr 汉语七大方言 + 20+ 口音官话,覆盖 30 种语种
全模态能力 qwen3.5-omni-plus 文本/图像/音频/音视频理解与交互,支持 10h 音频与 400s 音视频
图像生成 qwen-image-2.0 图片生成与编辑融合,专业文字渲染、真实质感、强语义遵循
图像编辑 qwen-image-2.0 智能编辑,支持多图合成
图生视频 happyhorse-1.0-i2v 精准理解文本语义,输出流畅自然的高质量视频
文生视频 happyhorse-1.0-t2v 高度还原动态画面,细节丰富
参考生视频 happyhorse-1.0-r2v 支持最多 9 张图片参考,稳定主体与场景保持
视频编辑 happyhorse-1.0-video-edit 自然语言指令编辑视频,支持最多 5 张图片参考

应用数据

能力 默认服务 简介
知识库 阿里云百炼知识库 多模态数据知识库增删改查检索,需 AccessKey 认证
记忆库 阿里云百炼记忆库 跨会话持久化存储,提供个性化连贯对话体验

应用构建

能力 默认服务 简介
工作流调用 工作流服务 调用已有的工作流应用服务
智能体调用 智能体服务 调用已有的智能体应用服务

工具能力

能力 默认服务 简介
联网搜索 bailian_web_search 实时互联网全栈信息检索,提升回答准确性及时效性
临时文件上传 临时文件上传服务 免费临时存储空间,上传本地文件获得 URL(有效期 48 小时)
模型额度查询 模型额度查询 根据模型id查询可以使用的免费额度
接口文档 阿里云百炼模型应用API调用参考文档 在构建应用的过程中,自动为您的应用集成阿里云百炼模型和应用能力API

CLI使用方法及场景案例


亚马逊电商营销套图生成:

根据这个模特图,给我生成一整套亚马逊电商营销套图,6张,图片地址是:https://img.alicdn.com/imgextra/i3/O1CN01g0lwbw1heN0yEAuZW_!!6000000004302-2-tps-1728-2368.png

新闻相声音频播客生成:

搜索今天关于AI新闻,给我生成一段相声,并且生成音频,需要男女音色区分的音频播客。

小红帽真人写实故事书生成:

帮我生成一部小红帽的故事书,真人写实版本,保持人物连续一致性,需要有 20 页,尺寸是 16:9 的,变成 PDF 给我。

隐藏富二代测试真爱短剧:

帮我创作一个短剧:男主是一个隐藏的富二代,为了测试女主是不是真心爱他,隐瞒了自己的家产,为了凑够彩礼和婚礼的钱,夜以继日地努力工作。然而,女主的闺蜜(不要太好看,创作一个相貌平平的角色)是一个嫉妒心极强的人,在婚车到达酒店时,煽动女主要高额下车礼,贬低低调男主(隐藏的富二代,为了测试女主是不是)不舍得给钱。然而男主手里已经没有钱了,被闺蜜百般羞辱,女主也维护闺蜜,反复强调“她是为我好”。男主的妈妈虽然不同意这门婚事,但是还是带着诚意满满的彩礼,现金 1000 万,5 套江城最好的别墅的产证,10 辆豪车的钥匙,没想到正好看到闺蜜在羞辱男主,当场面露愠色。闺蜜当场质疑男主母子的豪门身份,还破坏了他们的彩礼,嘲笑他们这些东西都是假的。最终,江城首富为了庆贺男主的婚礼,带着厚礼来到现场,这才坐实了男主的豪门身份。此时女主后悔不及,闺蜜成功破坏了女主的幸福,邪魅一笑,男主头也不回地走了。

更多关于阿里云百炼CLI命令行工具的说明,请移步到CLI官方查看:https://www.aliyun.com/product/bailian

相关文章
|
3天前
|
人工智能 自然语言处理 文字识别
阿里云百炼Qwen3.7-Max简介:能力、优势、支持订阅计划参考
Qwen3.7-Max是阿里云百炼面向智能体时代推出的新一代旗舰模型,对标GPT-5.5、Claude Opus 4.7等闭源旗舰。该模型支持百万级token上下文窗口,具备顶级推理能力、多模态搜索与视觉理解增强、流式输出低延迟响应等核心优势,覆盖编程、办公、长周期自主执行等复杂场景。同时支持OpenAI接口兼容,便于系统快速迁移。用户可通过Token Plan团队或节省计划等订阅方式灵活调用,适合企业级高要求场景使用。
8189 36
阿里云百炼Qwen3.7-Max简介:能力、优势、支持订阅计划参考
|
3天前
|
人工智能 运维 JavaScript
阿里云Qoder CN(原通义灵码)全解析 产品形态、版本划分与技术适配说明
在AI辅助开发与智能办公工具持续普及的当下,阿里云旗下原通义灵码正式更名为Qoder CN,同时延伸出QoderWork CN、Qoder CN CLI、Qoder CN Mobile等多款配套产品,形成覆盖代码开发、日常办公、终端交互、移动端使用的完整工具矩阵。Qoder CN核心定位为AI智能编码助手,深度适配主流代码编辑器、集成开发环境以及终端场景;QoderWork CN则偏向桌面端综合办公辅助,二者面向不同使用场景,划分了多个版本档位,搭配差异化资源配额、功能权限与计费规则,同时兼容多款主流大模型。
550 4
|
3天前
|
JavaScript 定位技术 API
CodeGraph 爆火:编程 Agent 需要的不是更多上下文,而是一张提前画好的代码地图
CodeGraph 是一款爆火的本地代码智能工具,通过 tree-sitter 解析 AST 构建结构化知识图谱(存于 SQLite),为编程 Agent 提前生成“代码地图”。它显著降低 Agent 在中大型项目中的探索成本——实测工具调用减少71%、Token 降57%、速度提升46%,支持19+语言及主流框架路由识别,完全离线、无需 API Key。
507 3
CodeGraph 爆火:编程 Agent 需要的不是更多上下文,而是一张提前画好的代码地图
|
2天前
|
缓存 测试技术 API
Qwen 3.7 Plus 与 Max 实测:性价比与多模态能力差异解析(2026)
2026 年 6 月 1 日,阿里悄无声息地发布了 Qwen 3.7 Plus,距 Qwen 3.7 Max 上线刚好 11 天。同样的 1M 上下文,同样的 35 小时自治上限。但价格才是头条:Plus 是 0.40/M输入,Max是 2.50/M——便宜约 6 倍——并且还能看图、看视频。Vision Arena 上 Plus 已经排到 #16。所以这周真正值得讨论的问题不是”要不要为视觉能力买单”,而是”Max 凭什么用 6 倍价格换来 2 个百分点的 benchmark 领先”。
|
3天前
|
数据采集 人工智能 前端开发
让 Coding Agent 从黑盒到透明:阿里云 Agent 观测审计数据采集实践
AI Agent 规模化落地带来执行黑盒、行为难追溯、成本难度量三大难题。阿里云基于 OTel 标准,面向 Coding Agent、个人通用助理和框架型 Agent,推出 LoongSuite Pilot、插件及探针等无侵入采集方案,让 Agent 实现可看见、可分析、可审计、可治理。
690 149
|
3天前
|
人工智能 缓存 自然语言处理
阿里Qwen3.7-Max评测:Agent能力显著提升,耗时与调用成本大幅下降
阿里云百炼推出面向智能体的旗舰大模型Qwen3.7-Max,具备长周期自主执行能力,显著提升编程、办公自动化等复杂任务处理水平;支持MCP集成与多框架兼容,并以限时5折+100万Tokens免费试用大幅降低使用门槛,助力企业高效落地AI应用。在阿里云百炼平台快速体验:https://t.aliyun.com/U/fPVHqY
1917 10
|
3天前
|
存储 安全 Java
AgentScope Java 2.0:打造分布式、企业级智能体底座
AgentScope 2.0 面向分布式部署、稳定运行、权限安全等企业级需求全面升级,打造支持多租户隔离与长期稳定运行的企业级智能体底座。
|
3天前
|
人工智能 安全 定位技术
CodeGraph深度解析 让Claude Code工具调用直降七成的核心原理与实操教程
如今以Claude Code为代表的AI编程智能体已经成为开发者日常编码、项目重构、漏洞修复的必备工具。但在长期使用过程中,几乎所有开发者都会遇到同一个明显痛点:AI虽然具备强大的代码生成与分析能力,却常常陷入盲目探索的循环中。
1320 2
|
3天前
|
人工智能 运维 API
2026年阿里云百炼通义千问Qwen3.7-plus深度介绍 功能特性、使用优势及618大促订阅方案指南
大模型技术的普及,让AI能力逐步融入个人办公、内容创作、代码编写、企业运营、教育培训等各类场景。不同定位的模型对应不同使用需求,旗舰级模型性能强劲但使用成本偏高,轻量化模型价格低廉却难以胜任复杂任务,而介于两者之间的中端主力模型,凭借均衡的能力、亲民的定价、广泛的场景适配性,成为绝大多数个人用户、小型团队、中小企业的首选。
672 1
|
3天前
|
人工智能 弹性计算 运维
阿里云发布堡垒机智能运维Agent,运维交互进入自然语言新时代
支持自然语言运维,提升效率与安全双保障。
1183 1

热门文章

最新文章