视觉智能开放平台新增【图像搜索】【视频理解】【视频分割】【视频生成】四个类目,快来体验新功能吧!

本文涉及的产品
全局流量管理 GTM,标准版 1个月
视觉智能开放平台,图像资源包5000点
视觉智能开放平台,视频资源包5000点
简介: 尊敬的开发者您好,感谢您对阿里云视觉智能开放平台的支持,近期平台上线【图像搜索】【视频理解】【视频分割】【视频生成】这四个大类,共计10个视觉AI算法,分别是同图检测、视频镜头解析、视频封面、视频人像分割、视频调色、视频字幕擦除、视频标志擦除、电商视频摘要、影视视频摘要以及视频超分辨,接下来给您逐一介绍下。

本文关键词:同图检测、视频、字幕擦除、视频超分辨
  尊敬的开发者您好,感谢您对阿里云视觉智能开放平台(vision.aliyun.com)的支持,近期平台上线【图像搜索】【视频理解】【视频分割】【视频生成】这四个大类,共计10个视觉AI算法,分别是同图检测、视频镜头解析、视频封面、视频人像分割、视频调色、视频字幕擦除、视频标志擦除、电商视频摘要、影视视频摘要以及视频超分辨,接下来给您逐一介绍下。

  • 同图检测:【跳转链接】
      图像搜索服务基于阿里云深度学习技术,进行以图搜图,在指定图库中搜索出相同或相似的图片, 在使用之前需要创建对应的图片库并在图片库中加入对应的图片数据,以上工作准备好后,输入单张图片通过调用同图检测算法,会与图片库中的图片进行对比并进行结果的输出。例如在图片库中找到主体相同的图片,结合相似度分值,判断图片内容是否严格相同,可用于特定图片查找、图片内容精准关联等场景。
  • 视频人像分割:【跳转链接】
      对输入的视频进行内容理解,将人物进行高精分割解析,将人像区域的mask(掩模)作为视频序列返回。可广泛应用于影视、泛文娱、个人应用等各种场景。例如视频直播过程中,识别用户的人体轮廓,为人像实时增加各种设定的背景特效、贴纸道具,提供更加丰富的娱乐体验。

人像分割.png

  • 视频镜头解析:【跳转链接】
      可以对输入的视频按镜头切分,返回切分点,可以搭配视频封面功能对视频内容做相应的提炼。
  • 视频封面:【跳转链接】
      可以对输入的视频通过算法解析,把具有吸引力的内容进行输出,可输出多个视频封面。主要可应用在精彩视频推荐、视频精彩封面图等场景,例如为视频内容生成最精彩的封面,把最具吸引力的内容呈现出来,有效帮助提升视频内容的点击率,提高用户停留时长。
  • 影视视频摘要:【跳转链接】
      输入影视视频,通过算法进行视频解析,按照指定时长输出视频摘要。可应用在基于视频内容的理解和分析,将输入视频按照指定长度进行输出,保证视频内容精简视频长度,便于投放在不同平台和不同场景下使用。
  • 视频调色:【跳转链接】
      输入一组视频,输出一组调色后的视频。可根据视频之间的相似性进行关联调色。其目的主要是降低调色操作人员的学习门槛,因为视频调色,对多数人来说是比较难把握的技能,通过使用此算法可以实现降本增效。
  • 视频字幕擦除:【跳转链接】
      可以擦除视频中的标准字幕,例如老电影里面的字幕比较模糊,可以通过此能力去除字幕然后再添加较为清晰的弹幕,通过此能力可优化观看者的观看体验,主要应用在影视作品当中。

字幕擦除.png

  • 视频标志擦除:【跳转链接】
      可以擦除视频中的常见标志,如台标、互联网平台logo等。可应用在涉及到视频处理的行业,可有效减少擦除标志的人力成本。

台标.png

  • 电商视频摘要:【跳转链接】
      输入电商视频,通过算法进行视频解析,按照指定时长输出视频摘要。可应用在电商商品推荐的视频预览。
  • 视频超分辨:【跳转链接】
      将输入视频放大2倍尺寸输出,并基于推断细节增强输出视频画质,输出视频为h264编码、MP4格式。可应用在视频电影清晰度修复等场景。

  以上就是【图像搜索】【视频理解】【视频分割】【视频生成】此次更新的主要内容,各个算法服务的详细介绍由于篇幅原因就不在这里展示了,各个功能的具体介绍可点击能力后面的对应跳转链接查看,如果您对我们的产品感兴趣想要了解更多关于我们的内容,可点击下方链接访问我们的官网进行体验,也可搜索钉钉群23109592或是扫描文章结尾的钉群二维码,进群和我们沟通!
官网地址:https://vision.aliyun.com/
群二维码.jpg

相关文章
|
3月前
|
文字识别 算法 API
视觉智能开放平台产品使用合集之如何在线调用视频人像增强功能
视觉智能开放平台是指提供一系列基于视觉识别技术的API和服务的平台,这些服务通常包括图像识别、人脸识别、物体检测、文字识别、场景理解等。企业或开发者可以通过调用这些API,快速将视觉智能功能集成到自己的应用或服务中,而无需从零开始研发相关算法和技术。以下是一些常见的视觉智能开放平台产品及其应用场景的概览。
|
3月前
|
编解码 文字识别 API
视觉智能开放平台产品使用合集之是否支持视频和字幕同步
视觉智能开放平台是指提供一系列基于视觉识别技术的API和服务的平台,这些服务通常包括图像识别、人脸识别、物体检测、文字识别、场景理解等。企业或开发者可以通过调用这些API,快速将视觉智能功能集成到自己的应用或服务中,而无需从零开始研发相关算法和技术。以下是一些常见的视觉智能开放平台产品及其应用场景的概览。
|
3月前
|
文字识别 算法 API
视觉智能开放平台产品使用合集之通用视频生成的输出结果的清晰度低,可以怎么优化
视觉智能开放平台是指提供一系列基于视觉识别技术的API和服务的平台,这些服务通常包括图像识别、人脸识别、物体检测、文字识别、场景理解等。企业或开发者可以通过调用这些API,快速将视觉智能功能集成到自己的应用或服务中,而无需从零开始研发相关算法和技术。以下是一些常见的视觉智能开放平台产品及其应用场景的概览。
32 0
|
5月前
|
文字识别 API 开发工具
视觉智能开放平台产品使用合集之模板视频人脸融合是否支持通过服务端调用或者客户端调用
视觉智能开放平台是指提供一系列基于视觉识别技术的API和服务的平台,这些服务通常包括图像识别、人脸识别、物体检测、文字识别、场景理解等。企业或开发者可以通过调用这些API,快速将视觉智能功能集成到自己的应用或服务中,而无需从零开始研发相关算法和技术。以下是一些常见的视觉智能开放平台产品及其应用场景的概览。
视觉智能开放平台产品使用合集之模板视频人脸融合是否支持通过服务端调用或者客户端调用
|
5月前
|
文字识别 算法 API
视觉智能开放平台产品使用合集之调用通用视频生成后输出的视频在播放到一半时出现没有声音,一般是什么导致的
视觉智能开放平台是指提供一系列基于视觉识别技术的API和服务的平台,这些服务通常包括图像识别、人脸识别、物体检测、文字识别、场景理解等。企业或开发者可以通过调用这些API,快速将视觉智能功能集成到自己的应用或服务中,而无需从零开始研发相关算法和技术。以下是一些常见的视觉智能开放平台产品及其应用场景的概览。
|
5月前
|
文字识别 算法 API
视觉智能开放平台产品使用合集之如何解决视频生成接口中声音和画面不同步
视觉智能开放平台是指提供一系列基于视觉识别技术的API和服务的平台,这些服务通常包括图像识别、人脸识别、物体检测、文字识别、场景理解等。企业或开发者可以通过调用这些API,快速将视觉智能功能集成到自己的应用或服务中,而无需从零开始研发相关算法和技术。以下是一些常见的视觉智能开放平台产品及其应用场景的概览。
视觉智能开放平台产品使用合集之如何解决视频生成接口中声音和画面不同步
|
5月前
|
监控 算法 API
视觉智能开放平台操作报错合集之视频分割服务调用过程中遇到调用报错的问题,该怎么处理
在使用视觉智能开放平台时,可能会遇到各种错误和问题。虽然具体的错误代码和消息会因平台而异,但以下是一些常见错误类型及其可能的原因和解决策略的概述,包括但不限于:1. 认证错误、2. 请求参数错误、3. 资源超限、4. 图像质量问题、5. 服务不可用、6. 模型不支持的场景、7. 网络连接问题,这有助于快速定位和解决问题。
|
5月前
|
对象存储
视觉智能开放平台操作报错合集之用oss上传视频后,发起调用报错是什么导致的
在使用视觉智能开放平台时,可能会遇到各种错误和问题。虽然具体的错误代码和消息会因平台而异,但以下是一些常见错误类型及其可能的原因和解决策略的概述,包括但不限于:1. 认证错误、2. 请求参数错误、3. 资源超限、4. 图像质量问题、5. 服务不可用、6. 模型不支持的场景、7. 网络连接问题,这有助于快速定位和解决问题。
|
5月前
|
文字识别 算法 API
视觉智能开放平台产品使用合集之视频生成资源包提示QPS(每秒查询率)超限时,该如何扩容
视觉智能开放平台是指提供一系列基于视觉识别技术的API和服务的平台,这些服务通常包括图像识别、人脸识别、物体检测、文字识别、场景理解等。企业或开发者可以通过调用这些API,快速将视觉智能功能集成到自己的应用或服务中,而无需从零开始研发相关算法和技术。以下是一些常见的视觉智能开放平台产品及其应用场景的概览。
|
5月前
|
文字识别 算法 API
视觉智能开放平台产品使用合集之保存视频图片,存到自己服务器,该如何操作
视觉智能开放平台是指提供一系列基于视觉识别技术的API和服务的平台,这些服务通常包括图像识别、人脸识别、物体检测、文字识别、场景理解等。企业或开发者可以通过调用这些API,快速将视觉智能功能集成到自己的应用或服务中,而无需从零开始研发相关算法和技术。以下是一些常见的视觉智能开放平台产品及其应用场景的概览。