视觉智能开放平台新增【图像搜索】【视频理解】【视频分割】【视频生成】四个类目,快来体验新功能吧!

本文涉及的产品
视觉智能开放平台,图像资源包5000点
视觉智能开放平台,视频资源包5000点
视觉智能开放平台,分割抠图1万点
简介: 尊敬的开发者您好,感谢您对阿里云视觉智能开放平台的支持,近期平台上线【图像搜索】【视频理解】【视频分割】【视频生成】这四个大类,共计10个视觉AI算法,分别是同图检测、视频镜头解析、视频封面、视频人像分割、视频调色、视频字幕擦除、视频标志擦除、电商视频摘要、影视视频摘要以及视频超分辨,接下来给您逐一介绍下。 

本文关键词:同图检测、视频、字幕擦除、视频超分辨
  尊敬的开发者您好,感谢您对阿里云视觉智能开放平台(vision.aliyun.com)的支持,近期平台上线【图像搜索】【视频理解】【视频分割】【视频生成】这四个大类,共计10个视觉AI算法,分别是同图检测、视频镜头解析、视频封面、视频人像分割、视频调色、视频字幕擦除、视频标志擦除、电商视频摘要、影视视频摘要以及视频超分辨,接下来给您逐一介绍下。

  • 同图检测:【跳转链接】
      图像搜索服务基于阿里云深度学习技术,进行以图搜图,在指定图库中搜索出相同或相似的图片, 在使用之前需要创建对应的图片库并在图片库中加入对应的图片数据,以上工作准备好后,输入单张图片通过调用同图检测算法,会与图片库中的图片进行对比并进行结果的输出。例如在图片库中找到主体相同的图片,结合相似度分值,判断图片内容是否严格相同,可用于特定图片查找、图片内容精准关联等场景。
  • 视频人像分割:【跳转链接】
      对输入的视频进行内容理解,将人物进行高精分割解析,将人像区域的mask(掩模)作为视频序列返回。可广泛应用于影视、泛文娱、个人应用等各种场景。例如视频直播过程中,识别用户的人体轮廓,为人像实时增加各种设定的背景特效、贴纸道具,提供更加丰富的娱乐体验。

人像分割.png

  • 视频镜头解析:【跳转链接】
      可以对输入的视频按镜头切分,返回切分点,可以搭配视频封面功能对视频内容做相应的提炼。
  • 视频封面:【跳转链接】
      可以对输入的视频通过算法解析,把具有吸引力的内容进行输出,可输出多个视频封面。主要可应用在精彩视频推荐、视频精彩封面图等场景,例如为视频内容生成最精彩的封面,把最具吸引力的内容呈现出来,有效帮助提升视频内容的点击率,提高用户停留时长。
  • 影视视频摘要:【跳转链接】
      输入影视视频,通过算法进行视频解析,按照指定时长输出视频摘要。可应用在基于视频内容的理解和分析,将输入视频按照指定长度进行输出,保证视频内容精简视频长度,便于投放在不同平台和不同场景下使用。
  • 视频调色:【跳转链接】
      输入一组视频,输出一组调色后的视频。可根据视频之间的相似性进行关联调色。其目的主要是降低调色操作人员的学习门槛,因为视频调色,对多数人来说是比较难把握的技能,通过使用此算法可以实现降本增效。
  • 视频字幕擦除:【跳转链接】
      可以擦除视频中的标准字幕,例如老电影里面的字幕比较模糊,可以通过此能力去除字幕然后再添加较为清晰的弹幕,通过此能力可优化观看者的观看体验,主要应用在影视作品当中。

字幕擦除.png

  • 视频标志擦除:【跳转链接】
      可以擦除视频中的常见标志,如台标、互联网平台logo等。可应用在涉及到视频处理的行业,可有效减少擦除标志的人力成本。

台标.png

  • 电商视频摘要:【跳转链接】
      输入电商视频,通过算法进行视频解析,按照指定时长输出视频摘要。可应用在电商商品推荐的视频预览。
  • 视频超分辨:【跳转链接】
      将输入视频放大2倍尺寸输出,并基于推断细节增强输出视频画质,输出视频为h264编码、MP4格式。可应用在视频电影清晰度修复等场景。

  以上就是【图像搜索】【视频理解】【视频分割】【视频生成】此次更新的主要内容,各个算法服务的详细介绍由于篇幅原因就不在这里展示了,各个功能的具体介绍可点击能力后面的对应跳转链接查看,如果您对我们的产品感兴趣想要了解更多关于我们的内容,可点击下方链接访问我们的官网进行体验,也可搜索钉钉群23109592或是扫描文章结尾的钉群二维码,进群和我们沟通!
官网地址:https://vision.aliyun.com/
群二维码.jpg

相关文章
|
6月前
|
机器学习/深度学习 人工智能 开发工具
视觉智能平台常见问题之设置默认使用单类目资源包而不是通用资源包如何解决
视觉智能平台是利用机器学习和图像处理技术,提供图像识别、视频分析等智能视觉服务的平台;本合集针对该平台在使用中遇到的常见问题进行了收集和解答,以帮助开发者和企业用户在整合和部署视觉智能解决方案时,能够更快地定位问题并找到有效的解决策略。
|
人工智能 JSON 文字识别
视觉智能开放平台【文字识别】类目新增五个AI算法,快来看看吧~
尊敬的开发者您好,感谢您对阿里云视觉智能平台的支持,近期平台在【文字识别】大类下上线了5个视觉AI算法,分别是文档结构化还原识别、中国护照识别、护照MRZ码识别、外卖单识别以及验证码识别,接下来给您逐一介绍下。 
视觉智能开放平台【文字识别】类目新增五个AI算法,快来看看吧~
|
人工智能 监控 算法
视觉智能开放平台【人脸人体】类目上线了包含人脸比对1:N在内的9个算法,重点还免费,快来看看吧!
尊敬的开发者您好,感谢您对阿里云视觉智能平台的支持,近期平台在【人脸人体】大类下上线了9个视觉AI算法,分别是人脸比对1:N、人体姿势关键点、手姿势关键点、人脸美妆、人脸美型、行人检测、人脸修复增强以及人脸滤镜,接下来给您逐一介绍下。
视觉智能开放平台【人脸人体】类目上线了包含人脸比对1:N在内的9个算法,重点还免费,快来看看吧!
|
人工智能 监控 算法
阿里云视觉智能开放平台【人脸人体类目】上线多个AI能力,快来了解下!
为了帮助开发者将视觉Ai能力应用到更多的场景中,阿里云视觉智能开放平台(vision.aliyun.com)近期上线了多项和视觉相关的AI能力,快来了解下吧!
阿里云视觉智能开放平台【人脸人体类目】上线多个AI能力,快来了解下!
|
文字识别 安全 黑灰产治理
视觉智能开放平台上线新能力啦,涵盖多个类目!确定不来看看么?
尊敬的开发者您好,感谢您对阿里云视觉智能平台的支持,近期平台上线了多项算法能力,涉及了图像增强、内容安全、文字识别、目标检测以及图像分割等多个类目,接下来给您逐一介绍下。
视觉智能开放平台上线新能力啦,涵盖多个类目!确定不来看看么?
|
3月前
|
文字识别 算法 API
视觉智能开放平台产品使用合集之人脸数据库容量是否支持扩容
视觉智能开放平台是指提供一系列基于视觉识别技术的API和服务的平台,这些服务通常包括图像识别、人脸识别、物体检测、文字识别、场景理解等。企业或开发者可以通过调用这些API,快速将视觉智能功能集成到自己的应用或服务中,而无需从零开始研发相关算法和技术。以下是一些常见的视觉智能开放平台产品及其应用场景的概览。
|
3月前
|
文字识别 算法 API
视觉智能开放平台产品使用合集之处理一张图片大概耗时多久
视觉智能开放平台是指提供一系列基于视觉识别技术的API和服务的平台,这些服务通常包括图像识别、人脸识别、物体检测、文字识别、场景理解等。企业或开发者可以通过调用这些API,快速将视觉智能功能集成到自己的应用或服务中,而无需从零开始研发相关算法和技术。以下是一些常见的视觉智能开放平台产品及其应用场景的概览。
|
3月前
|
API 开发工具 Android开发
视觉智能开放平台产品使用合集之人脸活体检测能力是否支持Android端或者iOS端直接调用
视觉智能开放平台是指提供一系列基于视觉识别技术的API和服务的平台,这些服务通常包括图像识别、人脸识别、物体检测、文字识别、场景理解等。企业或开发者可以通过调用这些API,快速将视觉智能功能集成到自己的应用或服务中,而无需从零开始研发相关算法和技术。以下是一些常见的视觉智能开放平台产品及其应用场景的概览。
|
3月前
|
文字识别 算法 API
视觉智能开放平台产品使用合集之如何提高换脸的真实性
视觉智能开放平台是指提供一系列基于视觉识别技术的API和服务的平台,这些服务通常包括图像识别、人脸识别、物体检测、文字识别、场景理解等。企业或开发者可以通过调用这些API,快速将视觉智能功能集成到自己的应用或服务中,而无需从零开始研发相关算法和技术。以下是一些常见的视觉智能开放平台产品及其应用场景的概览。
|
3月前
|
存储 移动开发 数据库
视觉智能开放平台产品使用合集之人脸数据库容量是否支持扩容
视觉智能开放平台是指提供一系列基于视觉识别技术的API和服务的平台,这些服务通常包括图像识别、人脸识别、物体检测、文字识别、场景理解等。企业或开发者可以通过调用这些API,快速将视觉智能功能集成到自己的应用或服务中,而无需从零开始研发相关算法和技术。以下是一些常见的视觉智能开放平台产品及其应用场景的概览。

相关产品

  • 视觉智能开放平台
  • 下一篇
    无影云桌面