虚拟数字人开放平台,是由阿里云所提供的数字人服务,它集成了自然语言处理、图形图像、语音等算法能力,提供给客户标准的 PaaS 接口与后台运营工具,方便客户将数字人能力集成进不同的终端与场景。主要面对的行业包括新零售、政务、金融、运营商、传媒等,场景包括数字人大屏、数字人直播、数字人客服、数字人长/短视频、数字人助理等。
https://help.aliyun.com/document_detail/392353.htm?spm=a2c4g.11174283.0.0.df60406cXJkach
虚拟数字人开放平台
一、定义与产品架构 定义: 虚拟数字人开放平台是阿里云提供的集成了自然语言处理、图形图像、语音等算法能力的数字人服务。该平台面向新零售、政务、金融、运营商、传媒等行业,适用于数字人大屏、数字人直播、数字人客服、数字人长/短视频、数字人助理等多种场景。它通过提供标准的PaaS接口与后台运营工具,助力客户将数字人能力无缝集成到不同终端与场景中。 产品架构: 虚拟数字人开放平台支持3D和2D两种数字人形式。其中,3D数字人由三维建模制作,而2D数字人则源自真人照片或视频制作。平台的核心产品能力包括数字人流媒体、数字人视频合成和数字人资产库,旨在帮助开发者快速构建各类数字人应用。
二、产品能力概述 1. 3D数字人流媒体 - 功能:实时驱动3D数字人进行文本播报,支持通过API接收文本数据,处理成数字人的声音、表情、口型、动作,并通过流媒体技术合成视频流输出至阿里云RTC或客户指定的RTMP流媒体服务器。 - 模板:提供播报数字人、互动数字人、推流数字人三种模板,分别适用于数字人资讯播报、数字人客服助理、数字人虚拟直播等场景。互动数字人需结合智能对话机器人使用。
2. 数字人视频合成
内置资产:支持3D卡通、美型、2D真人形象,以及普通话、方言等发音人。
高内聚标准接口:封装数字人渲染、驱动、构建、互动能力,降低研发周期与成本。
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。