【视觉智能产品速递——视频人脸融合产品能力升级】

简介: 本文介绍视频生产(videoenhan)类目下的通用视频人脸融合MergeVideoFace的功能介绍以及代码示例。

一、产品描述

1.产品概述

     在获得用户授权的前提下,视频人脸融合可以精准地定位视频中的人脸,将用户上传的目标人脸照片与另一个人的人脸形象进行面部融合,达到换脸的感官效果。 支持单脸、多脸、选脸融合应用场景。

免费试用直通车🚝视频人脸融合—能力展示

   

2. 功能介绍

  1. 支持多人脸融合


融合前

1687165096320-f16765f8-a090-4f73-8ca5-28d9423f3522.jpg

融合人脸1

1687165126849-cb9cbf90-52dc-4c7e-b120-77df0b6a7702.jpg

融合人脸2

融合后

  1. 指定人脸融合

d1bc8dffeebce2d6b2fc7201a8591d35.gif

原视频-指定融合左侧女孩

1686898594758-1be9ff2d-21c7-41eb-8b19-bcf9ca9fc802.png

融合人脸

2.gif

  • 融合后

3. 应用场景

  • 影视后期制作:在影视后期制作时,因为某些原因需要替换演员,通过视频人脸融合技术,可利用前期拍摄素材进行处理,让前期视频素材中的人物看起来是新的演员在表演,可以为制片方节省大量的重新拍摄成本。
  • 娱乐性短视频制作:用户可以将已获授权的合法视频中的人物,换成自己的人脸,生成趣味性视频。
  • 虚拟试衣制作:在婚纱摄影、民族服饰、汉服、仿妆等试衣场景,通过视频人脸融合技术进行服饰虚拟试穿。
  • 电商数字人直播:在电商卖货带货直播场景,通过网红脸ID换脸实现数字人直播带货、虚拟人换脸。


4. 产品优势

  • 高保真、低违和效果:融合后的人脸保留了替换者人脸身份信息的视觉特征,而融入被替换者人脸中又无违和感,融合效果自然。算法业界领先,融合效果自然,对真人、油画、水彩等风格兼容性好。
  • 表情肤色一致性:融合后的人脸最大限度保留被替换者的面目表情、肤色一致性。
  • 支持复杂人脸角度:支持模板人脸偏侧一定角度,融合后的结果真实稳定。
  • 支持多人脸指定换脸:支持视频中含有多张人脸,并指定每个脸与不同的用户脸进行融合,可应用在全家福、婚纱摄影、多人角色创作等多人互动场景。
  • 超大容量:同一用户最多可支持上传3000个视频模板。


5.产品收费

视频人脸融合能力支持按量付费通用预付费资源包方式进行计费。

按量付费:计费标准为1元/分钟

通用预付费资源包:阿里云视觉智能开放平台提供首次购买5000点规格享0元免费试用

资源包支持叠加购买,当资源包点数耗尽或过期后,将按照按量付费进行计费。资源包有效期1年。


详情请点击🚝:视频人脸融合功能付费


二、代码示例

1.请求示例

http(s)://videoenhan.cn-shanghai.aliyuncs.com/?Action=MergeVideoModelFace //更多关于访问域名(Endpoint)信息,请参见:https://help.aliyun.com/document_detail/143103.html &TemplateId=3bf2418c-7adf-4002-a9d6-2f7cf1889c0d &FaceImageURL=http://viapi-test.oss-cn-shanghai.aliyuncs.com/viapi-3.0domepic/videoenhan/MergeVideoFace/MergeVideoFace-xxxx.png &MergeInfos=[{"TemplateFaceID":"f913c614-d542-42ba-b173-07db2058c207_0","TemplateFaceURL":"f913c614-d542-42ba-b173-07db2058c207_0","ImageURL":"http://viapi-test.oss-cn-shanghai.aliyuncs.com/test-team/MergeVideoModelFace/xxx.jpg"}] &公共请求参数


2.正常返回示例

XML格式

HTTP/1.1 200 OK Content-Type:application/xml 334F180F-3B50-51CB-B4CB-9A86A542D3BC该调用为异步调用,任务已提交成功,请以requestId的值作为jobId参数调用同类目下GetAsyncJobResult接口查询任务执行状态和结果。

JSON格式

HTTP/1.1200OKContent-Type:application/json { "RequestId" : "334F180F-3B50-51CB-B4CB-9A86A542D3BC", "Message" : "该调用为异步调用,任务已提交成功,请以requestId的值作为jobId参数调用同类目下GetAsyncJobResult接口查询任务执行状态和结果。" }


3.返回示例补充说明

//查询结果:请求示例http(s)://videoenhan.cn-shanghai.aliyuncs.com/?Action=GetAsyncJobResult &JobId=E75FE679-0303-4DD1-8252-1143B4FA8A27 &<公共请求参数> //查询结果:返回示例 { "RequestId" : "43A0AEB6-45F4-4138-8E89-E1A5D63200E3", "Data" : { "Status" : "PROCESS_SUCCESS", "JobId" : "186AC396-0EEC-46F1-AAA1-BF3585227427", "Result" : "{\"VideoURL\":\"http://vibktprfx-prod-prod-aic-gd-cn-shanghai.oss-cn-shanghai.aliyuncs.com/video-face-fusion/334F180F-3B50-51CB-B4CB-9A86A542D3BC-5716-20210906-074905.mp4?Expires=1630916420&OSSAccessKeyId=LTAI4FoLmvQ9urWXgSRp****&Signature=OEtNqVYxXRwkyO4BrsYVJ8q5bx****\"}" } } //Result反序列化 { "VideoURL" : "http://vibktprfx-prod-prod-aic-gd-cn-shanghai.oss-cn-shanghai.aliyuncs.com/video-face-fusion/334F180F-3B50-51CB-B4CB-9A86A542D3BC-5716-20210906-074905.mp4?Expires=1630916420&OSSAccessKeyId=LTAI4FoLmvQ9urWXgSRp****&Signature=OEtNqVYxXRwkyO4BrsYVJ8q5bx****" }


三、新功能直通车


想了解更多相关信息,详情见   阿里云——视觉智能开放平台—产品文档

免费试用直通车🚝       视频人脸融合—能力展示

相关文章
|
文字识别 算法 API
视觉智能开放平台产品使用合集之处理一张图片大概耗时多久
视觉智能开放平台是指提供一系列基于视觉识别技术的API和服务的平台,这些服务通常包括图像识别、人脸识别、物体检测、文字识别、场景理解等。企业或开发者可以通过调用这些API,快速将视觉智能功能集成到自己的应用或服务中,而无需从零开始研发相关算法和技术。以下是一些常见的视觉智能开放平台产品及其应用场景的概览。
241 1
|
API 开发工具 Android开发
视觉智能开放平台产品使用合集之人脸活体检测能力是否支持Android端或者iOS端直接调用
视觉智能开放平台是指提供一系列基于视觉识别技术的API和服务的平台,这些服务通常包括图像识别、人脸识别、物体检测、文字识别、场景理解等。企业或开发者可以通过调用这些API,快速将视觉智能功能集成到自己的应用或服务中,而无需从零开始研发相关算法和技术。以下是一些常见的视觉智能开放平台产品及其应用场景的概览。
204 1
|
文字识别 算法 API
视觉智能开放平台产品使用合集之如何批量添加人脸数据
视觉智能开放平台是指提供一系列基于视觉识别技术的API和服务的平台,这些服务通常包括图像识别、人脸识别、物体检测、文字识别、场景理解等。企业或开发者可以通过调用这些API,快速将视觉智能功能集成到自己的应用或服务中,而无需从零开始研发相关算法和技术。以下是一些常见的视觉智能开放平台产品及其应用场景的概览。
220 2
|
编解码 文字识别 API
视觉智能开放平台产品使用合集之是否支持视频和字幕同步
视觉智能开放平台是指提供一系列基于视觉识别技术的API和服务的平台,这些服务通常包括图像识别、人脸识别、物体检测、文字识别、场景理解等。企业或开发者可以通过调用这些API,快速将视觉智能功能集成到自己的应用或服务中,而无需从零开始研发相关算法和技术。以下是一些常见的视觉智能开放平台产品及其应用场景的概览。
159 1
|
编解码 API 数据库
视觉智能开放平台产品使用合集之用Score还是Confidence可以判断人脸相似度
视觉智能开放平台是指提供一系列基于视觉识别技术的API和服务的平台,这些服务通常包括图像识别、人脸识别、物体检测、文字识别、场景理解等。企业或开发者可以通过调用这些API,快速将视觉智能功能集成到自己的应用或服务中,而无需从零开始研发相关算法和技术。以下是一些常见的视觉智能开放平台产品及其应用场景的概览。
225 1
|
4月前
|
机器学习/深度学习 人工智能 文字识别
中药材图像识别数据集(100类,9200张)|适用于YOLO系列深度学习分类检测任务
本数据集包含9200张中药材图像,覆盖100种常见品类,已标注并划分为训练集与验证集,支持YOLO等深度学习模型。适用于中药分类、目标检测、AI辅助识别及教学应用,助力中医药智能化发展。
|
11月前
|
机器学习/深度学习 人工智能 算法
基于Python深度学习的【害虫识别】系统~卷积神经网络+TensorFlow+图像识别+人工智能
害虫识别系统,本系统使用Python作为主要开发语言,基于TensorFlow搭建卷积神经网络算法,并收集了12种常见的害虫种类数据集【"蚂蚁(ants)", "蜜蜂(bees)", "甲虫(beetle)", "毛虫(catterpillar)", "蚯蚓(earthworms)", "蜚蠊(earwig)", "蚱蜢(grasshopper)", "飞蛾(moth)", "鼻涕虫(slug)", "蜗牛(snail)", "黄蜂(wasp)", "象鼻虫(weevil)"】 再使用通过搭建的算法模型对数据集进行训练得到一个识别精度较高的模型,然后保存为为本地h5格式文件。最后使用Djan
626 1
基于Python深度学习的【害虫识别】系统~卷积神经网络+TensorFlow+图像识别+人工智能
|
12月前
|
机器学习/深度学习 人工智能 算法
基于Python深度学习的【蘑菇识别】系统~卷积神经网络+TensorFlow+图像识别+人工智能
蘑菇识别系统,本系统使用Python作为主要开发语言,基于TensorFlow搭建卷积神经网络算法,并收集了9种常见的蘑菇种类数据集【"香菇(Agaricus)", "毒鹅膏菌(Amanita)", "牛肝菌(Boletus)", "网状菌(Cortinarius)", "毒镰孢(Entoloma)", "湿孢菌(Hygrocybe)", "乳菇(Lactarius)", "红菇(Russula)", "松茸(Suillus)"】 再使用通过搭建的算法模型对数据集进行训练得到一个识别精度较高的模型,然后保存为为本地h5格式文件。最后使用Django框架搭建了一个Web网页平台可视化操作界面,
1161 11
基于Python深度学习的【蘑菇识别】系统~卷积神经网络+TensorFlow+图像识别+人工智能
|
机器学习/深度学习 人工智能 算法
【宠物识别系统】Python+卷积神经网络算法+深度学习+人工智能+TensorFlow+图像识别
宠物识别系统,本系统使用Python作为主要开发语言,基于TensorFlow搭建卷积神经网络算法,并收集了37种常见的猫狗宠物种类数据集【'阿比西尼亚猫(Abyssinian)', '孟加拉猫(Bengal)', '暹罗猫(Birman)', '孟买猫(Bombay)', '英国短毛猫(British Shorthair)', '埃及猫(Egyptian Mau)', '缅因猫(Maine Coon)', '波斯猫(Persian)', '布偶猫(Ragdoll)', '俄罗斯蓝猫(Russian Blue)', '暹罗猫(Siamese)', '斯芬克斯猫(Sphynx)', '美国斗牛犬
630 29
【宠物识别系统】Python+卷积神经网络算法+深度学习+人工智能+TensorFlow+图像识别
|
机器学习/深度学习 网络架构 计算机视觉
深度学习在图像识别中的应用与挑战
【10月更文挑战第21天】 本文探讨了深度学习技术在图像识别领域的应用,并分析了当前面临的主要挑战。通过研究卷积神经网络(CNN)的结构和原理,本文展示了深度学习如何提高图像识别的准确性和效率。同时,本文也讨论了数据不平衡、过拟合、计算资源限制等问题,并提出了相应的解决策略。
396 19