让故事"活"起来:用阿里云百炼生成有声绘本,开启AI创意教育新体验#小有可为#有温度的AI

简介: 无需专业设计技能,通过自然语言对话即可在几分钟内生成图文并茂的有声故事绘本。适合亲子阅读、儿童教育、内容创作等场景,让每个孩子都能拥有专属的定制故事书。

先来看看最终效果:

merged_video.mp4

本案例以经典童话《小红帽》为例,展示如何通过 Qwen Code(AI编程助手) + 阿里云百炼 CLI(大模型命令行工具) 的组合,自动生成包含20页漫画风格插图和配套旁白语音的完整绘本。

最终产出:

小红帽故事绘本

小红帽旁白音频


第一步:安装 Qwen Code

什么是 Qwen Code

Qwen Code 是通义千问团队推出的 AI 编程助手,可以通过自然语言对话帮你写代码、调试、重构。支持命令行交互,是 Vibe Coding 的核心工具。

image.png

下载与安装

打开终端,根据系统选择安装命令,并执行以下命令全局安装:

Linux / macOS

bash -c "$(curl -fsSL https://qwen-code-assets.oss-cn-hangzhou.aliyuncs.com/installation/install-qwen.sh)" -s --source qwenchat

Windows

curl -fsSL -o %TEMP%\install-qwen.bat https://qwen-code-assets.oss-cn-hangzhou.aliyuncs.com/installation/install-qwen.bat && %TEMP%\install-qwen.bat --source qwenchat

image.png

安装完成之后就会出现 Qwen Code 的开始界面:

image.png

完成安装后需要配置阿里云百炼的 Token Plan。Token Plan 是阿里云百炼推出的 AI 大模型订阅服务,以 Credits 统一计量,支持文本生成与图像生成模型,兼容主流 AI 编程与智能体工具,提供团队管理后台、数据安全保障,确保调用平稳运行。

image.png

启动 Qwen Code 后输入 /auth 命令进行可视化配置:

image.png

依次选择 订阅计划 > 阿里云百炼 Token Plan

image.png

输入 Token Plan 团队版专属 API Key 即可完成配置:

image.png

image.png


第二步:安装阿里云百炼 CLI

什么是阿里云百炼 CLI

阿里云百炼 CLI(bl 命令)是阿里云百炼平台的命令行工具,可以让 Qwen Code 具备这些开箱即用的功能:

image.png

image.png

下载与安装

复制第一段话到 Qwen Code,Qwen Code 会自动帮你安装阿里云百炼 CLI:

请阅读:https://bailian.aliyun.com/cli/install.md 并按照说明为我安装阿里云百炼 CLI

image.png

安装之后,会自动弹出阿里云百炼 CLI 的鉴权方式。如果没有的话,手动输入"使用 console 登录"这段文字,选择 1,回车后会打开一个浏览器界面,登录即可。

image.png

image.png

登录成功:

image.png


第三步:用 Qwen Code 调用阿里云百炼 CLI 生成有声故事绘本

在 Qwen Code 的聊天窗口输入:

帮我生成一部小红帽的故事书,漫画风格版本,保持人物连续一致性,需要有 20 页,尺寸是 16:9 的,变成 PDF 给我,并根据 pdf 故事情节,生成一段旁白语音讲述

image.png

Qwen Code 会自动规划方案并生成:

image.png

执行成功后,会在对应的文件下生成结果:

image.png

最终产出:

小红帽故事绘本

小红帽旁白音频


应用场景延展

这个工作流不仅限于童话故事,还可以应用于:

  • 个性化儿童读物:根据孩子的姓名、兴趣定制专属故事
  • 企业培训材料:快速生成带插图的员工手册、安全指南
  • 营销内容创作:品牌故事可视化,提升传播效果
  • 无障碍阅读:为视障人士生成带语音解说的图文内容

立即体验:访问 阿里云百炼官网 开通 Token Plan,开启你的 AI 创意之旅。


作品欢迎提交作品至仓库,增加作品影响力,一起开源建设,优秀作品会加入官方案例集,获得额外奖励

https://github.com/ModelStudioAI/modelstudioai.github.io/issues/new

总仓库地址,获取更多技能加持,赢胜比赛!https://github.com/modelstudioai


阿里云OPC创新助力计划:单客最高 100万等额 Token补贴、1V1技术陪跑、直通阿里云产品生态、品牌曝光加持、融资与创业空间对接等五大维度权益,加速AI原生新业态的繁荣发展。前往官网:https://opc.aliyun.com/  申领至高百万等额Token补贴。

相关文章
|
4天前
|
云安全 人工智能 运维
阿里云SecOps Agent,全新安全跨产品执行体验
自然语言驱动 云安全中心/WAF/CFW/ 等多款安全产品联动
1596 2
|
1天前
|
人工智能 定位技术 SEO
我学 GEO 第 15 天:终于知道AI GEO该如何做?
我是暴走的莉莉酱,边旅行边研究AI GEO的数字游民。专注普通人如何提升“AI可见度”——让AI在回答用户问题时准确识别、理解并推荐你。不讲玄学,只做可测、可调、可持续的GEO实践。
355 123
|
4天前
|
机器学习/深度学习 人工智能 调度
🐴 HappyHorse 1.1 现已上线阿里云百炼!快来查收模型使用指南,现在调用享 6 折~
HappyHorse 1.1 是新一代视频生成大模型,全面升级动态表现力、角色一致性、指令遵循、视觉质感与音画协同能力。支持I2V/T2V/R2V三类生成,适配短剧、电商广告、品牌营销等场景,提供高质、流畅、可控的AI视频生产力。
596 4
🐴 HappyHorse 1.1 现已上线阿里云百炼!快来查收模型使用指南,现在调用享 6 折~
|
15天前
|
缓存 测试技术 API
Qwen 3.7 Plus 与 Max 实测:性价比与多模态能力差异解析(2026)
2026 年 6 月 1 日,阿里悄无声息地发布了 Qwen 3.7 Plus,距 Qwen 3.7 Max 上线刚好 11 天。同样的 1M 上下文,同样的 35 小时自治上限。但价格才是头条:Plus 是 0.40/M输入,Max是 2.50/M——便宜约 6 倍——并且还能看图、看视频。Vision Arena 上 Plus 已经排到 #16。所以这周真正值得讨论的问题不是”要不要为视觉能力买单”,而是”Max 凭什么用 6 倍价格换来 2 个百分点的 benchmark 领先”。
|
15天前
|
JavaScript 定位技术 API
CodeGraph 爆火:编程 Agent 需要的不是更多上下文,而是一张提前画好的代码地图
CodeGraph 是一款爆火的本地代码智能工具,通过 tree-sitter 解析 AST 构建结构化知识图谱(存于 SQLite),为编程 Agent 提前生成“代码地图”。它显著降低 Agent 在中大型项目中的探索成本——实测工具调用减少71%、Token 降57%、速度提升46%,支持19+语言及主流框架路由识别,完全离线、无需 API Key。
923 12
CodeGraph 爆火:编程 Agent 需要的不是更多上下文,而是一张提前画好的代码地图
|
8天前
|
缓存 人工智能 运维
GLM 5.2自托管全流程实战:硬件选型、vLLM/SGLang部署与成本盈亏测算
2026年智谱发布GLM 5.2超大混合专家模型,区别于以往仅开放API的闭源大模型,该模型权重以MIT开源协议对外发布,企业与开发者可完整下载、本地审计、私有化部署,实现数据不出环境、自定义微调、自主调度推理资源。GLM 5.2拥有753B总参数,原生支持百万级上下文窗口,在代码生成、长文档推理、数学逻辑等多项基准测试中对标国际顶尖商用模型,是首款可完整自托管的前沿代码向大模型。
678 0
|
3天前
|
消息中间件 人工智能 Kafka
AI 时代,实时入湖正在告别 ETL:从 Kafka 到 Iceberg 的架构减法
本文围绕“零 ETL”这一趋势,讨论流数据入湖为什么需要做架构减法,并结合 Kafka × Table Bucket 的实践,分析一种将通用入湖能力前移到消息与表存储链路中的方案,如何在降低复杂度的同时,兼顾实时性、一致性、Schema 演进、CDC 语义与开放生态兼容。
193 121
|
3天前
|
人工智能 监控 前端开发
Electron 监控:让桌面 Agent 监控触手可及
一行代码实现Electron桌面端全景监控,自动还原崩溃现场、预警内存泄漏、全链路追踪、 SSE流式响应与交互埋点,让 AI 助手运行状态清晰可见,助力快速恢复稳定与流畅。
185 125
|
11天前
|
人工智能 自然语言处理 算法
阿里云百炼Qwen 3.7 Plus与Max实测全解:性价比与多模态能力、成本深度对比
2026年,阿里云百炼平台推出的Qwen 3.7系列成为企业与开发者落地AI应用的核心选择,其中Qwen 3.7 Max与Plus作为两大旗舰版本,定位差异显著:Max是纯文本推理旗舰,专注高强度智能体与复杂逻辑任务;Plus则是多模态全能版,在保留强大文本能力的同时,补齐图像、视频理解能力,且价格大幅降低。本文基于2026年最新实测数据,从核心参数、文本能力、多模态能力、智能体表现、性价比与场景选型六大维度,全面解析两款模型的差异,为用户提供精准选型参考。
549 0