如何 get 一个终身免费续期的定制数字人?

本文涉及的产品
智能媒体服务,推流SDK标准版 1年
智能媒体服务,播放器SDK标准版 1年
简介: 活动有效期到什么时间?限时福利活动有效期为 2023 年 11 月 30 日 24 点前请在规定期内完成数字人定制任务提交操作。

定制周期长?训练、运营成本高?成片效果生硬?无法应用于实际场景?

随着 AIGC 技术的快速发展,虚拟数字人的生成效率不断提高,训练成本逐渐降低,与此同时,生成效果也朝着更加精细化方向发展。

越来越多的 “数字人” 正在走入各行各业,不受空间、时间的限制,解放着人们的生产力。

来了!阿里云智能媒体服务正式推出:数字人形象和人声特征克隆模型的自助训练,一站式提供文本、语音驱动的仿真形象合成及视频终片创作的完整能力。

文末更有限时福利,让您的 “数字分身” 永久免费续期~

形象、声音、生产力
首先,我们来看看如何定义一个好的数字人服务?

一是数字人的 “形象”,无论是动作、表情、还是口型等需要具有高还原度的拟真效果,这也是数字人服务的基石;

二是数字人的 “声音”,去僵硬、机器感,以同步拟真的声音,进一步提升数字人的生动感、完整度;

在拟真的形象与声音之上,三是能将数字人运用于视频、直播等场景化创作,让以技术驱动的 “人” 带来真正的生产力;

四是数字人与背景、前景等多类元素合成时,需要充分融合表达画面一致性,提升视觉细节精致度和画面感染力, 这更是最终数字人成品质量的关键。

数字人的「超级服务方案」
阿里云智能媒体服务的数字人,是整合仿真形象渲染、声音克隆和视频精编二创的一体化服务方案。

|「形」:数字人形象训练及渲染

通过采集模特特定场景下播报形象的视频素材,以文本、语音驱动经过算法训练的 “数字人”,生成多语种、任意语料、带有丰富拟真表情和动作的数字人视频。

对于 2D 真人形象定制,我们提供规范的 SOP 录制手册,可依据手册轻松自助完成训练素材的录制、编辑和上传,实现拟真度极高的形象表达。

DEMO 视频:https://v.youku.com/v_show/id_XNjAxOTM1NzM2OA==.html

|「声」:人声克隆训练及渲染

当前人声克隆分为专业定制版、轻量定制版及基础版。

基础版在线可用,系统自动分配 20 句文案简单录制,覆盖故事、交互、导航三大细分场景,便捷快速复刻人声。通过用户上传的录音内容,30min 即可捕捉关键声纹特征克隆人声,达到用户级娱乐效果。

轻量定制版(重点介绍)基于视频云多年深耕音视频算法,融合音质检测、音频降噪和数字克隆的多维度算法,基于 15-30min 有效音频,即可高保真还原音色。同时还可随着使用需求不同,指定音色情绪,满足不同应用场景的声音灵活适配。

人声克隆轻量定制版 Demo:

原始训练声音(截取):https://v.youku.com/v_show/id_XNjAxOTM1NzU5Mg==.html

声音克隆结果:https://v.youku.com/v_show/id_XNjAyMjA1NTc0NA==.html

|「效」:场景化视频抠除及背景融合

对于绿幕 / 实景视频,除了抠出内容边界清晰、自然无残漏的人像,还能指定抠出人像附属物,如:桌面、手持物品等。

实景抠图带附属物效果

即使数字人在不同光线及色彩环境下,也能自动将数字人与背景进行一致化融合处理,实现视频全片自然统一的超自然合成效果。

自动适配冷暖色调融合效果:https://v.youku.com/v_show/id_XNjAyMjA1NDA4MA==.html

|「创」:丰富的衍生制作能力及精编二创

阿里云「云端智能剪辑」提供专业的音视频剪辑(多层级元素、专业字幕、转场过渡、特效滤镜) 能力及完善的视频模版工具。

通过浏览器非线性编辑器或 AE 制作模版库,结合数字人自动化渲染,可实现数字人名片、数字人慕课等标准模版组合方案,满足短视频、教学视频、广告宣传等各类数字人视频制作的要求。

浏览器剪辑界面

|「互」:数字人直播实时互动

基于数字人直播及实时互动的标准场景,我们即将提供开箱即用的 SaaS 工具,从直播间装修、数字人脚本设定到互动方案及数字人响应内容预置,实现一键开播。

直播间不仅支持多个官方数字人形象,并支持自助训练数字人。

如下方视频所示,客户通过阿里云智能媒体服务进行数字人及人声克隆(轻量定制版)定制及视频合成,将其运用于法律、财经知识的重点解读。

客户案例示例:https://v.youku.com/v_show/id_XNjAyMjA2MDAzMg==.html

“训” 一个数字分身!
数字人自助训练定制,已上线阿里云「智能媒体服务」!

只需 4 步,即可 “训” 一个数字分身。

1️⃣ Step 1: 风格确认

﹣ 2D 仿真人|3D 卡通人

﹣ 性别确认、形象风格

﹣ 视频成片调性、主播姿态设计

2️⃣ Step 2: 真人拍摄

﹣ 绿幕(建议)或实景环境确认

﹣ 按照操作手册自助录制

﹣ 生成初版训练视频

3️⃣ Step 3: 内容预处理

﹣ 美颜处理

﹣ 抠图处理(平台也可自动扣图)

﹣ 生成终版训练视频

4️⃣ Step 4: 形象定制训练

﹣ 形象渲染

﹣ 生成形象 code

「限时福利」,终身免费续期!

为了感谢您对数字人定制服务的关注与支持,我们重磅推出了一项 “限时福利”,在活动有效期内发起定制数字人服务,即可享受终身免费续期的特权!

活动有效期到什么时间?
限时福利活动有效期为 2023 年 11 月 30 日 24 点前请在规定期内完成数字人定制任务提交操作。

该福利适用什么平台?
当前限时福利仅适用于通过阿里云智能媒体服务发起数字人定制的用户。

活动开始前已定制的数字人是否适用当前活动?
适用。只要在活动结束时间之前发起定制任务,均满足活动条件,自动享受福利特权。

相关文章
|
自然语言处理 算法 视频直播
|
6月前
|
传感器 人工智能 搜索推荐
|
11天前
|
API 语音技术 开发者
基于开源技术的数字人实时对话:形象可自定义,支持语音输入,对话首包延迟可低至3s
魔搭社区最近上线了基于开源技术的数字人实时对话demo,无需预训练即可使用自定义的数字人形象进行实时对话,支持语音输入和实时对话。
|
3月前
|
机器学习/深度学习 人工智能 自然语言处理
【人工智能】python之人工智能应用篇--数字人生成技术
数字人生成技术是基于人工智能技术和计算机图形学技术创建的虚拟人物形象的技术。该技术能够模拟人类的外貌、声音、动作和交流能力,为多个领域带来创新的应用可能性。数字人的本质是将所有信息(数字和文字)通过数字处理(如计算机视觉、语音识别等)再进行表达的过程,形成具有人类形态和行为的数字产物。 数字人的生成涉及到多种技术,如3D重建技术,使用三维扫描仪扫描人的外观、五官等,并通过3D模型重建三维人;虚拟直播技术,使用计算机技术生成人物或实体,并且可以实时直播、录制;数字人体数据集技术,利用数据构建数字人模型以及训练虚拟现实引擎等
114 4
|
4月前
|
新零售 人工智能 vr&ar
国家发展改革委等部门:鼓励利用数字人等技术拓展电商直播场景!
国家发改委推出措施鼓励创新消费场景,特别提到利用AI、VR等技术增强购物体验,支持数字人电商。青否数字人直播系统提供独立部署方案,适应抖音直播并解决封号问题,具备实时话术改写和AI智能回复功能,确保互动合规。此系统适用于24小时直播,降低商家成本,提升效率。欲了解更多信息,可访问:zhibo175。
国家发展改革委等部门:鼓励利用数字人等技术拓展电商直播场景!
|
5月前
|
算法
VASA-1:实时音频驱动的数字人说话面部视频生成技术
【6月更文挑战第8天】VASA-1是实时音频驱动的数字人面部视频生成技术,能根据输入音频精准生成匹配的面部表情。具备实时性、高准确性和适应性,适用于虚拟主播、在线教育和影视娱乐等领域。简单示例代码展示了其工作原理。尽管面临情感理解和硬件优化等挑战,但随着技术发展,VASA-1有望在更多领域广泛应用,开启生动数字世界的新篇章。
279 5
|
5月前
|
机器学习/深度学习 人工智能 自然语言处理
【数字人】AIGC技术引领数字人革命:从制作到应用到全景解析
【数字人】AIGC技术引领数字人革命:从制作到应用到全景解析
636 0
|
传感器 人工智能 达摩院
带你读《2022技术人的百宝黑皮书》——虚拟数字人行业现状和技术研究(1)
带你读《2022技术人的百宝黑皮书》——虚拟数字人行业现状和技术研究
188 0
带你读《2022技术人的百宝黑皮书》——虚拟数字人行业现状和技术研究(1)
|
编解码 自然语言处理 算法
虚拟数字人之《手语翻译官》的技术实践
虚拟数字人之《手语翻译官》的技术实践
20285 0
虚拟数字人之《手语翻译官》的技术实践
|
对象存储 流计算 CDN
带你读《2022技术人的百宝黑皮书》——虚拟数字人行业现状和技术研究(2)
带你读《2022技术人的百宝黑皮书》——虚拟数字人行业现状和技术研究
185 0

热门文章

最新文章

下一篇
无影云桌面