《AI 剧本生成与动画创作》解决方案测评

本文涉及的产品
通义法睿合同智能审查,1个月8份合同免费体验
简介: 这篇评测介绍了2025年首个AI剧本生成与动画创作解决方案。该方案结合阿里云的函数计算、对象存储OSS和百炼大模型服务,通过API调用实现剧本生成、语音合成及字幕生成等功能,适用于教育、短视频、游戏娱乐等领域。评测详细描述了部署流程,包括开通相关服务、准备物料、应用体验等环节,并对视频生成过程中的用户体验进行了总结和优化建议。整体而言,方案操作简便,但视频生成耗时较长且存在一些功能限制,如缺少进度条、多任务支持不足等。希望开发者们积极参与分享真实体验,共同推动技术进步。

这一篇测评算是真正意义上2025年的第一篇解决方案评测,因为发布在2015年的第一个月,在过去的一年中我一共参与并发布了13篇解决方案类评测文章,得到了官方和不少开发者们的点赞支持,在此表示由衷的感谢,我也会继续用心体验并分享。在过去一年来的解决方案测评从一开始的摸索不完善到如今的全新蜕变,已成为开发社区除了产品测评外的一种全新的测评方式,正在吸引一大批开发者们参与。希望大家可以踊跃参加,把你最真实的体验感受和建议分享出来。以下是活动首页,可点击下方链接前往:

解决方案评测|AI 剧本生成与动画创作

每一期的解决方案评测我都有参与,以下是我往期的评测文章,欢迎各位前来打卡点评。

《多模态数据信息提取》解决方案测评

《主动式智能导购AI助手构建》解决方案评测

《文档智能 & RAG让AI大模型更懂业务》解决方案评测

《AI 大模型助力客户对话分析》解决方案评测

《触手可及,函数计算玩转 AI 大模型》解决方案评测

云消息队列RabbitMQ实践解决方案评测

基于hologres搭建轻量OLAP分析平台解决方案评测

《10 分钟构建 AI 客服并应用到网站、钉钉或微信中》解决方案体验评测

函数计算驱动多媒体文件处理解决方案体验评测

Serverless高可用架构体验评测

容器化管理云上应用体验评测

通义万相AI绘画创作体验评测

基于云效流水线高效构建企业门户网站体验评测

方案速览

按照传统惯例,这里还是先呈上方案的整个页面截图,供不愿意点击链接查看的伙伴们查阅。从方案整体来看,还是一如既往的样式和排版,分成了五个大模块进行阐述。接下来将逐个分析。

image.png

方案的一开始便阐述了四点优势,分别从技术难度、生产效率、灵活程度和成本效率四个方面进行了简述。在技术难度和成本效率上,主要是基于函数计算FC所能带来的直接结果,而从生产效率和灵活程度上,则最终受益于应用服务本身。

紧接着阐述了方案的架构和实现原理,如下:

img

从架构上用户可以非常直观清晰读懂其业务关联性和具体实现流程,分别涉及到阿里云的三个产品或服务,如下:

  • 1个函数计算 FC 应用:分别部署 ComfyUI 和 WebUI 两个函数。
  • 1个对象存储 OSS Bucket:存储图片、音频、视频等。
  • 百炼模型服务:调用 API 完成剧本生成,语音合成和字幕相关信息生成。

接下来讲到了方案的具体应用场景,分别是教育、短视频、游戏娱乐及内容安全。实际上应用场景可以更广泛,比如企业客服、电商服务、广告传媒。

再接着针对方案涉及的产品给出了免费试用的通道,但这里显然是缺少内容的,比如对于百炼平台,并没有提供试用通道。

方案的最后列举了类似方案或者案例供用户选择。

部署体验

在正式部署体验前,相关的产品和服务需要先开通。新用户都可以在方案的免费试用处领取对应产品的试用额度。方案这里并没有提供百炼平台的开通链接,大家可以点击我这里提供的。大模型服务平台百炼控制台

image.png

为了方便更多新手小白用户快速开通,尽可能通过一篇文档就能实现开通并部署,这里还是提供一下各个产品服务开通的方法。

服务开通

开通阿里云百炼

由于本次解决方案实现涉及的服务有函数计算FC、阿里云百炼产品,如果你是新用户,是基本没有体验费用的,因为可以领取试用额度,尤其是函数计算FC;而对于百炼产品,目前尚处公测阶段,开通服务即可免费获得试用额度,如下将展开阐述如何开通云百炼服务。

首先访问大模型服务平台百炼控制台首次进入需要同意服务协议,点击同意。如下:

image

在首页/模型广场/应用广场,均可点击开通模型调用服务。新用户首次访问将有100次提问额度。额度用完后需开通服务后方可继续使用。如下:

image

image

image

点击开通,如下:

image

使用阿里云百炼大模型服务,需要开通【百炼大模型推理】【百炼大模型部署】【百炼大模型训练】商品,并创建模型调用API-KEY。勾选协议,点击确认开通。如下:

image

开通服务后将会收到三条开通百炼大模型推理、百炼大模型部署、百炼大模型训练商品成功的短信通知。

至此,我们就完成了阿里云百炼大模型服务产品的开通,也就是开启了百炼产品的免费试用。接下来还需要开通函数计算FC,接下来就阐述如何开通函数计算服务。

开通函数计算

在服务开通前有必要先了解下函数计算的计费方式,产品共提供了三种方式,有试用额度、按量付费和资源包。计费项由函数调用次数、资源使用量和公网出流量组成。详细的可以点击链接前往了解详情。

如果你是第一次使用函数计算产品的,可以先领取一个免费的试用额度。如下:

image

但如果你是函数计算的老客户,要么按量付费,要么购买资源包,这里推荐经常使用的朋友购买资源包或者调整函数实例并发度来降低成本。

点击链接进入函数计算控制台,默认进入的是2.0版本的首页,点击首页右上角的体验函数计算3.0便可来到新版首页。

image.png

首次体验需要SLR授权,如下图,点击确定即可。

image.png

开通对象存储OSS

进入OSS控制台,创建存储桶Bucket,可直接点击下图的两个位置进入创建页面。

image.png

选择快捷创建,填入Bucket名称和地域信息即可,其他保持默认,如下:

image.png

到这,部署体验前的产品和服务的开通就已经全部完成了。下面就分别就各个应用部署进行体验。

物料准备

由于接下来的所有实践都需要用到百炼平台的API-KEY,这里就提前准备并记录好。如下:

首先登录阿里云百炼大模型服务平台,获取API-KEY,如下:

image.png

在弹出窗口中创建一个新API-KEY。

image

完成后记录好这个KEY值,以方便后面函数计算部署服务时填入使用。

image.png

应用体验

在方案的方案介绍内容处点击立即部署或者方案首页右上角的在线部署即可,跳转到云起实验室,按照部署方案进行相应操作。如下

image.png

在云起实验文档的部署应用处点击前往部署,如下:

image.png

在函数计算应用部署页,选择直接部署,选择部署地域(这里的地域选择要保持和上述物料准备中创建的存储桶所在地域保持一致),填入百炼的API-KEY和对象存储桶,点击“创建并部署默认环境”。如下:

image.png

开始部署将跳转到应用部署详情。

image.png

在这里我们可以直观看到部署的全部信息,包括步骤和详细日志。

大概2分半钟后,当部署状态变成部署成功并生成可访问的URL时,表明服务已经完成部署,可点击URL进行应用的访问体验了。

image.png

点击URL来到应用首页,左侧是内容输入区,右侧默认是步骤流程图。在左侧文本输入区还提供了两个示例,可点击直接使用。

image.png

这里先用示例体验一番,选中需要的官方示例,点击使用该实例并点击生成视频按钮。对于剧本提示词如何填写页面上提供了官方教程。

image.png

生成视频耗时较长,我这里大概耗时15分钟,主要耗时步骤在第二和第三步,生成过程中会有相对耗时提示。如下:

image.png

生成的视频是一个完整的剧本叙事,生成结果下方会有按章节裁剪的故事段落,用户可以按需选择。

image.png

image.png

视频效果如下:

https://www.bilibili.com/video/BV1KzPTeNEni/

为了更好体验并分享,我选用了一个喵咪大战狗狗的剧本故事,因为这里我并没有使用人物来叙事,看看生成视频效果会如何。首先上传一个喵咪的图片,上传后应用会自动提取特征,当然这里并非人物,所以特征提取并不理想,这里需要手动补全。

描述:性别(男),年龄(8-12),眼睛(蓝色/绿色瞳孔),头发(金黄)

提示词:后末日时代,流浪猫首领灰影带领族群占据百货商场,守护仅存的小鱼干贩卖机。机械改造犬军团突袭抢夺资源,灰影利用猫薄荷扰乱敌军,策反被人类遗弃的金毛犬“轮胎”。高潮对决中,灰影揭露恶犬首领铁颚项圈里的人类遗弃录像,瓦解其斗志。胜利的猫咪将狗皮制成战旗,而灰影凝视全家福回忆温暖过往。结尾新改装车队的逼近,暗示资源战争永无休止。全剧融合废土朋克与动物权谋,探讨背叛与生存的残酷法则。

旁白声音:男声。

image.png

https://www.bilibili.com/video/BV1KzPTeNEUa/

不得不说,这剧本视频效果还真的不错,值得点赞。

体验总结

方案体验

1、在方案优势描述中出现了字体样式不统一的问题,如优势第三点,灵活性和定制化,应该是粗体样式。此外,这里虽然提到了定制化,但实际体验中应用并没有提供定制化的功能,这对于方案来说可能是个功能缺失。

image.png

2、在方案的免费试用模块,存在缺少产品链接或者试用开通的内容,比如提到了百炼,但没有给到用户一个可以直接试用的链接。

image.png

部署体验

整个部署过程还是非常顺畅的,提供的部署文档也非常详细,即使是小白新手也完全可以按照步骤很好地完成部署并体验。本次体验,服务部署耗时在2分半钟内,对于体验用户来说还是非常快捷高效的。

我首先尝试了使用官方示例,通过选用一个示例,点击生成视频即可实现体验,对于用户来说这操作体验还是非常顺畅且实用的。但这里也存在吐槽的点,就是视频生成过程耗时较长,尤其是第二和第三步基本耗时在10分钟以上,对于初次体验的用户来说不太友好,但从实际应用立场来看,这个时间还算是适中的。

如上体验虽然符合预期,但对于正式应用来说还存在如下不足:

1、生成视频过程中,虽然有预计耗时提示,但对于体验用户来说,这样的提示会非常不友好,不如进度条来的直观好用。还有就是生成过程时看不到输出日志的,需要去对应函数下开启日志功能才可以收集并查看,这个对于生产来说意味着功能缺失,建议默认开启日志功能,方便用户实时查看。

最最需要注意的一点时,生成视频过程中不能刷新该页面,否则得重来。可这个设计也是不友好的,实际应用中难免会遇到此类意外中断的情况,如果要重来对于生产势必造成不小的影响。(实际上任务进程是保留在后台运行的,当你继续同样示例运行时会报错误,如下,这个时候你还想继续运行的话得删除函数再次创建了)

image.png

针对如上的情况,实际上可以有多种优化方法,第一,对于意外中断的页面任务,当再次打开页面会有任务在运行中的提示。第二,当用户再次提交同样进程时会有提示,已经有相同任务在运行,请耐心等待任务运行完成后再继续。第三,就是干脆支持多任务并发,可以同时多进程运行。

2、目前应用页面上只有人物形象,对于想用动物或者其他物体叙事的用户来说,这里就显得功能单调。对于正式环境建议还是支持多物体为好,这样用户就可以自由创作而不局限于功能限制了。这里应用本身是支持其他物体创作的,只是这里没有标明而已,建议修改成物体形象更为贴切。

image.png

3、这里应该是个老生常谈的问题了,就是对于需要填入提示词的场景,建议增加智能优化功能,一方面可以大大提升提示词的准确度,二来可以让用户更精准获得所需信息。

image.png

4、生成的视频格式为mp4,且视频画幅是竖屏的,这种格式和样式可能更多地适用于短视频场景;对于广告和营销可能需要其他格式和样式,比如avi,16:9的画幅等。还有视频帧数也不能自定义。建议增加这些常用视频参数的选项,可以满足用户更多的个性化定制要求。

5、官方示例数量相对较少,仅提供了两个,且示例内容可能过于简单,无法充分展示解决方案的全部功能和特点。比如多语言、多旁白。

相关实践学习
如何快速创建插件agent
阿里云百炼应用基于Assistant API技术架构,结合大语言模型(LLM)的推理、知识检索增强、插件调度等能力,构建应对各类复杂场景任务的场景应用。通过集成化、直观易用的产品界面,为开发者提供了丰富的应用配置选项,包括大型语言模型(LLM)选择、Pro
目录
相关文章
|
1月前
|
消息中间件 存储 负载均衡
AI 推理场景的痛点和解决方案
一个典型的推理场景面临的问题可以概括为限流、负载均衡、异步化、数据管理、索引增强 5 个场景。通过云数据库 Tair 丰富的数据结构可以支撑这些场景,解决相关问题,本文我们会针对每个场景逐一说明。
539 148
AI 推理场景的痛点和解决方案
|
15天前
|
人工智能 搜索推荐 开发者
GPT-4o测评准确率竟不到1%!BrowseComp:OpenAI开源AI代理评测新基准,1266道高难度网络检索问题
OpenAI最新开源的BrowseComp基准包含1266个高难度网络检索问题,覆盖影视、科技、艺术等九大领域,其最新Deep Research模型以51.5%准确率展现复杂信息整合能力,为AI代理的浏览能力评估建立新标准。
80 4
GPT-4o测评准确率竟不到1%!BrowseComp:OpenAI开源AI代理评测新基准,1266道高难度网络检索问题
|
1天前
|
人工智能 安全 Java
对比测评:为什么AI编程工具需要 Rules 能力?
AI规则引导模型生成更为精准、符合个人偏好或项目风格的代码与回答。
|
1月前
|
人工智能 JavaScript Java
深度测评国产 AI 程序员,在 QwQ 和满血版 DeepSeek 助力下,哪些能力让你眼前一亮?
阿里云发布并开源全新的推理模型通义千问QwQ-32B。通过大规模强化学习,千问QwQ-32B在数学、代码及通用能力上实现质的飞跃,整体性能比肩DeepSeek-R1。在保持强劲性能的同时,千问QwQ-32B还大幅降低了部署使用成本,在消费级显卡上也能实现本地部署。
423 57
|
1月前
|
人工智能 Java 测试技术
通义灵码2.0·AI程序员加持下的智能编码实践与测评
通义灵码2.0是阿里云推出的新一代智能编程助手,集成DeepSeek模型并新增多项功能,显著提升开发效率。本文通过实际项目体验新功能开发、跨语言编程、单元测试自动生成和图生代码等功能,展示其在代码生成、质量内建和人机协作方面的优势。相比1.0版本,2.0在模型选择、代码质量和用户体验上均有显著提升。尽管存在依赖网络和多语言混合项目中的不足,但整体表现优异,极大优化了开发流程。[了解更多](https://lingma.aliyun.com/)
398 59
|
5天前
|
人工智能 搜索推荐 IDE
突破网页数据集获取难题:Web Unlocker API 助力 AI 训练与微调数据集全方位解决方案
本文介绍了Web Unlocker API、Web-Scraper和SERP API三大工具,助力解决AI训练与微调数据集获取难题。Web Unlocker API通过智能代理和CAPTCHA绕过技术,高效解锁高防护网站数据;Web-Scraper支持动态内容加载,精准抓取复杂网页信息;SERP API专注搜索引擎结果页数据抓取,适用于SEO分析与市场研究。这些工具大幅降低数据获取成本,提供合规保障,特别适合中小企业使用。粉丝专属体验入口提供2刀额度,助您轻松上手!
36 2
|
1月前
|
数据采集 存储 机器学习/深度学习
最新AI大模型数据集解决方案:分享两种AI高质量代码数据集生产方案
本文分享了两种构建高质量AI代码数据集的解决方案。第一种是传统方式,结合动态住宅代理与手动处理,通过分页读取和数据清洗生成结构化数据;第二种是利用Web Scraper API工具,实现自定义配置、自动化抓取及云端存储。两种方法各具优势,适合不同需求和技术水平的团队。同时,文章还提供了专属优惠福利,助力提升数据采集效率,为AI大模型训练提供支持。
71 5
最新AI大模型数据集解决方案:分享两种AI高质量代码数据集生产方案
|
1月前
|
人工智能 弹性计算 运维
|
1月前
|
人工智能 运维 安全
更低成本、更高效、更安全!阿里云与钉钉联合推出协同办公AI解决方案
阿里云与钉钉携手推出了全新的“钉钉·AI Stack一体机”,以“低成本、高安全、零门槛”为核心,为用户提供基于钉钉,从模型部署到全员落地的AI解决方案,开启智能化办公的“一键加速”。
214 1
|
1月前
|
人工智能 安全 API
AI 解决方案的安全控制设计与实施
AI 解决方案的安全控制设计与实施涵盖数据安全、模型安全、系统安全及合规治理四大领域。通过数据加密、访问控制、差分隐私等手段保障数据安全;采用对抗训练、联邦学习确保模型安全;利用容器化部署、可信执行环境维护系统安全;并遵循 GDPR 等法规,进行红队测试和应急响应,确保 AI 全生命周期的安全性与合规性。
下一篇
oss创建bucket