【视觉智能产品速递——视频人脸融合产品能力升级】

本文涉及的产品
视觉智能开放平台,分割抠图1万点
视觉智能开放平台,图像资源包5000点
视觉智能开放平台,视频资源包5000点
简介: 本文介绍视频生产(videoenhan)类目下的通用视频人脸融合MergeVideoFace的功能介绍以及代码示例。

一、产品描述

1.产品概述

     在获得用户授权的前提下,视频人脸融合可以精准地定位视频中的人脸,将用户上传的目标人脸照片与另一个人的人脸形象进行面部融合,达到换脸的感官效果。 支持单脸、多脸、选脸融合应用场景。

免费试用直通车🚝视频人脸融合—能力展示

   

2. 功能介绍

  1. 支持多人脸融合


融合前

1687165096320-f16765f8-a090-4f73-8ca5-28d9423f3522.jpg

融合人脸1

1687165126849-cb9cbf90-52dc-4c7e-b120-77df0b6a7702.jpg

融合人脸2

融合后

  1. 指定人脸融合

d1bc8dffeebce2d6b2fc7201a8591d35.gif

原视频-指定融合左侧女孩

1686898594758-1be9ff2d-21c7-41eb-8b19-bcf9ca9fc802.png

融合人脸

2.gif

  • 融合后

3. 应用场景

  • 影视后期制作:在影视后期制作时,因为某些原因需要替换演员,通过视频人脸融合技术,可利用前期拍摄素材进行处理,让前期视频素材中的人物看起来是新的演员在表演,可以为制片方节省大量的重新拍摄成本。
  • 娱乐性短视频制作:用户可以将已获授权的合法视频中的人物,换成自己的人脸,生成趣味性视频。
  • 虚拟试衣制作:在婚纱摄影、民族服饰、汉服、仿妆等试衣场景,通过视频人脸融合技术进行服饰虚拟试穿。
  • 电商数字人直播:在电商卖货带货直播场景,通过网红脸ID换脸实现数字人直播带货、虚拟人换脸。


4. 产品优势

  • 高保真、低违和效果:融合后的人脸保留了替换者人脸身份信息的视觉特征,而融入被替换者人脸中又无违和感,融合效果自然。算法业界领先,融合效果自然,对真人、油画、水彩等风格兼容性好。
  • 表情肤色一致性:融合后的人脸最大限度保留被替换者的面目表情、肤色一致性。
  • 支持复杂人脸角度:支持模板人脸偏侧一定角度,融合后的结果真实稳定。
  • 支持多人脸指定换脸:支持视频中含有多张人脸,并指定每个脸与不同的用户脸进行融合,可应用在全家福、婚纱摄影、多人角色创作等多人互动场景。
  • 超大容量:同一用户最多可支持上传3000个视频模板。


5.产品收费

视频人脸融合能力支持按量付费通用预付费资源包方式进行计费。

按量付费:计费标准为1元/分钟

通用预付费资源包:阿里云视觉智能开放平台提供首次购买5000点规格享0元免费试用

资源包支持叠加购买,当资源包点数耗尽或过期后,将按照按量付费进行计费。资源包有效期1年。


详情请点击🚝:视频人脸融合功能付费


二、代码示例

1.请求示例

http(s)://videoenhan.cn-shanghai.aliyuncs.com/?Action=MergeVideoModelFace //更多关于访问域名(Endpoint)信息,请参见:https://help.aliyun.com/document_detail/143103.html &TemplateId=3bf2418c-7adf-4002-a9d6-2f7cf1889c0d &FaceImageURL=http://viapi-test.oss-cn-shanghai.aliyuncs.com/viapi-3.0domepic/videoenhan/MergeVideoFace/MergeVideoFace-xxxx.png &MergeInfos=[{"TemplateFaceID":"f913c614-d542-42ba-b173-07db2058c207_0","TemplateFaceURL":"f913c614-d542-42ba-b173-07db2058c207_0","ImageURL":"http://viapi-test.oss-cn-shanghai.aliyuncs.com/test-team/MergeVideoModelFace/xxx.jpg"}] &公共请求参数


2.正常返回示例

XML格式

HTTP/1.1 200 OK Content-Type:application/xml 334F180F-3B50-51CB-B4CB-9A86A542D3BC该调用为异步调用,任务已提交成功,请以requestId的值作为jobId参数调用同类目下GetAsyncJobResult接口查询任务执行状态和结果。

JSON格式

HTTP/1.1200OKContent-Type:application/json { "RequestId" : "334F180F-3B50-51CB-B4CB-9A86A542D3BC", "Message" : "该调用为异步调用,任务已提交成功,请以requestId的值作为jobId参数调用同类目下GetAsyncJobResult接口查询任务执行状态和结果。" }


3.返回示例补充说明

//查询结果:请求示例http(s)://videoenhan.cn-shanghai.aliyuncs.com/?Action=GetAsyncJobResult &JobId=E75FE679-0303-4DD1-8252-1143B4FA8A27 &<公共请求参数> //查询结果:返回示例 { "RequestId" : "43A0AEB6-45F4-4138-8E89-E1A5D63200E3", "Data" : { "Status" : "PROCESS_SUCCESS", "JobId" : "186AC396-0EEC-46F1-AAA1-BF3585227427", "Result" : "{\"VideoURL\":\"http://vibktprfx-prod-prod-aic-gd-cn-shanghai.oss-cn-shanghai.aliyuncs.com/video-face-fusion/334F180F-3B50-51CB-B4CB-9A86A542D3BC-5716-20210906-074905.mp4?Expires=1630916420&OSSAccessKeyId=LTAI4FoLmvQ9urWXgSRp****&Signature=OEtNqVYxXRwkyO4BrsYVJ8q5bx****\"}" } } //Result反序列化 { "VideoURL" : "http://vibktprfx-prod-prod-aic-gd-cn-shanghai.oss-cn-shanghai.aliyuncs.com/video-face-fusion/334F180F-3B50-51CB-B4CB-9A86A542D3BC-5716-20210906-074905.mp4?Expires=1630916420&OSSAccessKeyId=LTAI4FoLmvQ9urWXgSRp****&Signature=OEtNqVYxXRwkyO4BrsYVJ8q5bx****" }


三、新功能直通车


想了解更多相关信息,详情见   阿里云——视觉智能开放平台—产品文档

免费试用直通车🚝       视频人脸融合—能力展示

相关文章
|
3月前
|
文字识别 算法 API
视觉智能开放平台产品使用合集之人脸数据库容量是否支持扩容
视觉智能开放平台是指提供一系列基于视觉识别技术的API和服务的平台,这些服务通常包括图像识别、人脸识别、物体检测、文字识别、场景理解等。企业或开发者可以通过调用这些API,快速将视觉智能功能集成到自己的应用或服务中,而无需从零开始研发相关算法和技术。以下是一些常见的视觉智能开放平台产品及其应用场景的概览。
|
3月前
|
API 开发工具 Android开发
视觉智能开放平台产品使用合集之人脸活体检测能力是否支持Android端或者iOS端直接调用
视觉智能开放平台是指提供一系列基于视觉识别技术的API和服务的平台,这些服务通常包括图像识别、人脸识别、物体检测、文字识别、场景理解等。企业或开发者可以通过调用这些API,快速将视觉智能功能集成到自己的应用或服务中,而无需从零开始研发相关算法和技术。以下是一些常见的视觉智能开放平台产品及其应用场景的概览。
|
3月前
|
存储 移动开发 数据库
视觉智能开放平台产品使用合集之人脸数据库容量是否支持扩容
视觉智能开放平台是指提供一系列基于视觉识别技术的API和服务的平台,这些服务通常包括图像识别、人脸识别、物体检测、文字识别、场景理解等。企业或开发者可以通过调用这些API,快速将视觉智能功能集成到自己的应用或服务中,而无需从零开始研发相关算法和技术。以下是一些常见的视觉智能开放平台产品及其应用场景的概览。
|
3月前
|
文字识别 算法 API
视觉智能开放平台产品使用合集之如何提升人体人脸的QPS
视觉智能开放平台是指提供一系列基于视觉识别技术的API和服务的平台,这些服务通常包括图像识别、人脸识别、物体检测、文字识别、场景理解等。企业或开发者可以通过调用这些API,快速将视觉智能功能集成到自己的应用或服务中,而无需从零开始研发相关算法和技术。以下是一些常见的视觉智能开放平台产品及其应用场景的概览。
|
3月前
|
编解码 文字识别 API
视觉智能开放平台产品使用合集之是否支持视频和字幕同步
视觉智能开放平台是指提供一系列基于视觉识别技术的API和服务的平台,这些服务通常包括图像识别、人脸识别、物体检测、文字识别、场景理解等。企业或开发者可以通过调用这些API,快速将视觉智能功能集成到自己的应用或服务中,而无需从零开始研发相关算法和技术。以下是一些常见的视觉智能开放平台产品及其应用场景的概览。
|
3月前
|
编解码 API 数据库
视觉智能开放平台产品使用合集之用Score还是Confidence可以判断人脸相似度
视觉智能开放平台是指提供一系列基于视觉识别技术的API和服务的平台,这些服务通常包括图像识别、人脸识别、物体检测、文字识别、场景理解等。企业或开发者可以通过调用这些API,快速将视觉智能功能集成到自己的应用或服务中,而无需从零开始研发相关算法和技术。以下是一些常见的视觉智能开放平台产品及其应用场景的概览。
|
3月前
|
文字识别 算法 API
视觉智能开放平台产品使用合集之如何批量添加人脸数据
视觉智能开放平台是指提供一系列基于视觉识别技术的API和服务的平台,这些服务通常包括图像识别、人脸识别、物体检测、文字识别、场景理解等。企业或开发者可以通过调用这些API,快速将视觉智能功能集成到自己的应用或服务中,而无需从零开始研发相关算法和技术。以下是一些常见的视觉智能开放平台产品及其应用场景的概览。
|
6天前
|
机器学习/深度学习 人工智能 测试技术
深度学习在图像识别中的应用与挑战
本文探讨了深度学习技术,尤其是卷积神经网络(CNN)在图像识别任务中的最新进展和面临的主要挑战。通过分析不同的网络架构、训练技巧以及优化策略,文章旨在提供一个全面的概览,帮助研究人员和实践者更好地理解和应用这些技术。
36 9
|
3天前
|
机器学习/深度学习 人工智能 算法
深度学习在图像识别中的应用与挑战
本文探讨了深度学习技术在图像识别领域的应用,重点分析了卷积神经网络(CNN)的工作原理及其在处理图像数据方面的优势。通过案例研究,展示了深度学习如何提高图像识别的准确性和效率。同时,文章也讨论了当前面临的主要挑战,包括数据不足、过拟合问题以及计算资源的需求,并提出了相应的解决策略。
|
6天前
|
机器学习/深度学习 人工智能 计算机视觉
探索深度学习在图像识别中的突破与挑战##
本文深入探讨了深度学习技术在图像识别领域的最新进展,重点分析了卷积神经网络(CNN)作为核心技术的演变历程,从LeNet到AlexNet,再到VGG、ResNet等先进架构的创新点。不同于传统摘要形式,本文摘要旨在通过一系列关键里程碑事件,勾勒出深度学习推动图像识别技术飞跃的轨迹,同时指出当前面临的主要挑战,如模型泛化能力、计算资源依赖性及数据偏见问题,为读者提供一个宏观且具体的发展脉络概览。 ##
29 7