实验:计算机视觉技术简单实现

本文涉及的产品
智能开放搜索 OpenSearch行业算法版,1GB 20LCU 1个月
检索分析服务 Elasticsearch 版,2核4GB开发者规格 1个月
实时计算 Flink 版,5000CU*H 3个月
简介: 实验:计算机视觉技术简单实现

开发者学习笔记【阿里云人工智能工程师ACA认证(2023版):实验:计算机视觉技术简单实现

课程地址:https://edu.aliyun.com/course/3112108/lesson/19277

 

实验:计算机视觉技术简单实现

 

内容介绍:

、阿里巴巴视觉智能开放平台介绍

、快速分割图像中的服饰轮廓

、本章小结

 

一、阿里巴巴视觉智能开放平台介绍


视觉智能开放平台是基于阿里巴巴公司视觉技术的实践经验开发出的一个开放性平台。
图片589.png面向对象是视觉智能技术体验者和开发商,为其提供了高医用的、普惠性的 KPI 服务,使用视觉智能开放平台能够帮助使用者快速建立视觉智能应用的生活能力。
视觉智能开放平台覆盖多个行业,例如:交通、新媒体、互联网、医疗等多个行业,视觉智能开放平台也产生了许多应用场景,例如车辆进出管理,视觉智能开放平台在其中为其提供了车牌识别、驾驶证识别、行驶证识别、 VIN 码识别等能力。


在新媒体领域中视频质量增强这个应用场景中,视觉智能平台提供了视频超分辨、视频插帧、 SDR 转 HDR 的能力。在互联网领域中互动娱乐这个应用场景中,视觉智能开放平台提供了图像人脸融合、视频人脸融合、视频人像分割的能力。基于视觉智能开放平台的诸多能力也产生了许多的应用,例如在互动娱乐时利用视频人像分割来更换背景。


在医疗领域中卫生防疫这个应用场景中,视觉智能平台提供了人脸口罩检测、口罩人脸对比的能力。基于视觉智能平台人脸口罩检测的能力来检测来往人员是否佩戴口罩并对其进行报警和提示。利用口罩人脸对比在疫情期间为医疗、卫生防疫提供巨大支持。阿里云智能开放平台的能力不仅仅只有上述这些,其牵涉方向有十多个大方向,包括人脸人体装置识别、商品理解内容审核、图像识别、分割抠图、图像生产、视觉输送、视觉理解、视频分割、视频生产、视频搜索、目标检测、 3D 视觉、 VR 等能力牵涉方向。智能开放平台的这些能力都可以通过 VPI 方式透出其接入方式的多元化,可以快速接入使用,省心省力。

 

二、快速分割图像中的服饰轮廓


1、服饰分割-实验背景

在电商领域,经常需要随着不同的营销节日,有大规模批量化海报生产和投放的需求

从头进行海报的设计费时费力,而图像分割技术能够帮助设计人员快速搭配产出各类风格的电商

营销图片

利用抠图+模版方式,降低商家设计成本、提高设计效率。

下面来做一个实验,快速的分割图像里面的服饰轮廓,首先是实验背景,服饰分割的作用,在电商这个领域里经常会遇到这种需求,随着不同的营销节日,有大规模的批量化海报生产和投放的需求,比如母亲节,对妈妈的衣服有大量的海报要制作,因为衣服有很多款,如果从头设计海报会费时费力,这个时候可以用图像分割技术来帮助设计人员快速的搭成各种风格的电商营销图片,简单来说可以抠图,抠图后再合成新的图片,用抠图的模板的方式降低设计成本,提高设计效率。

图片590.png上图这种服装,如果想换一个模特,可能要找模特、找服装、拍摄、再修图等等,现在用抠图的方式把衣服从模特身上提取出来,希望得到的照片是右边这个结果,就成为一个模板,可以在新的设计里面用不同的模特换衣服,大大的提高了效率,这是企业的背景,服饰分割的作用。

2、服饰分割-实验步骤

首先进入阿里云达摩院视觉智能开放平台网站

登录阿里云账号

能力广场-分割抠图-商品分割-服饰分割

点击开通服饰分割功能

进入 PAI-DSW 平台

根据要求输入请求代码

接下来是服饰分割的实验步骤,首先要进入阿里云达摩院视觉智能开放平台网站,通过阿里云账号进入,在能力广场找分割抠图、商品分割、服饰分割专门用来做服饰分割,点击开通服饰分割功能,此时可以调用API,开通之后可以进入 PAI-DSW 平台,进入平台之后,根据要求输入请求,具体请求可以查询API的说明文档,会提示如何调用,打开PAI-DSW平台,调用很简单,几行代码

图片591.png上图是如何调用,看到打开的平台之后。先录入常用的术语,建立一个client,需要填上IP的信息等等。开通功能之后client可以来调用API,调用通过发一个request请求,接收一个格式,发送请求时,request要提交图片,可以看到上图方框中提交图片的链接地址,相当告诉图像分割功能的API,将哪个图片进行处理,图片的地址传送,写好之后点击运行,等待接收回复

图片592.png

回复的内容像上图一样,得到一个json格式的结果,结果中有一个图片的链接,是服饰分割后的结果,打开查看是否为满意的结果

经过调用API获得处理后的图像

处理前后的效果对比如下:

图片593.png左边是没有分割的,右边是服饰分割后的结果,大家是否服这个结果满意,调用API需要注意输入的限制,输入的限制包括图像的格式,能处理各种如PNG、JPG等的格式,图像的大小不能超过三兆,就图像的分辨率应该大于50*50,分辨率太小不好分割,小于3000*3000的像素,比较特殊的是地址里面的不能包含中文的字符,调用时请求的参数上文已经介绍,返回可以是json格式,还可以返回其他格式。阿里云的视觉智能开放平台其他的功能同服饰分割一样,功能上容易实现,代码简单容易操作,只需要几行代码。

 

三、本章小结


通过本章节的学习,我们学到了:

计算机视觉的定义、工作原理、关键技术、与人类视觉的关系和在行业中的典型应用

图像分类的定义、 类别和典型应用

目标检测的定义、评估指标和典型应用

图像分割的定义、类别和典型应用

阿里云视觉智能开放平台功能、 API调用方法

最后整体来做一个小结,通过学习,学到了计算机视觉的定义、工作原理、关键技术、与人类视觉的关系和在行业中的典型应用,重点讲了几个知识点,分别是图像分类,目标检测和图像分割,图像分类包括定义、类别以及典型类型用,目标检测包括定义、评估指标和典型应用,图像分割有定义、类别和典型应用,最后介绍了阿里云视觉智能开发平台有哪些功能,通过实验调用了平台提供的服饰分割的API。

相关文章
|
8月前
|
机器学习/深度学习 计算机视觉
AIGC核心技术——计算机视觉(CV)预训练大模型
【1月更文挑战第13天】AIGC核心技术——计算机视觉(CV)预训练大模型
672 3
AIGC核心技术——计算机视觉(CV)预训练大模型
|
8月前
|
算法 自动驾驶 安全
计算机视觉(CV)技术的优势和挑战
计算机视觉(CV)技术的优势和挑战
158 0
|
3月前
|
机器学习/深度学习 人工智能 机器人
计算机视觉技术介绍
【10月更文挑战第14天】 计算机视觉技术介绍
|
4月前
|
机器学习/深度学习 人工智能 自然语言处理
深度学习与计算机视觉的结合:技术趋势与应用
深度学习与计算机视觉的结合:技术趋势与应用
251 9
|
5月前
|
监控 算法 自动驾驶
计算机视觉的实践与挑战:技术深度剖析
【8月更文挑战第21天】计算机视觉技术作为人工智能的璀璨明珠,正逐步深入到我们生活的各个方面,带来前所未有的便利和变革。然而,随着技术的不断发展,我们也面临着诸多挑战和问题。未来,我们需要不断推动技术创新和跨学科合作,加强数据安全和隐私保护,提升算法的鲁棒性和可解释性,以应对这些挑战并推动计算机视觉技术的持续发展。让我们共同努力,探索计算机视觉技术的广阔天地,为创造一个更加智能、安全和美好的世界而不懈努力。
|
5月前
|
传感器 自动驾驶 安全
计算机视觉在自动驾驶中的应用:技术解析与未来展望
【8月更文挑战第4天】自动驾驶依托计算机视觉实现环境感知与决策,通过目标检测、跟踪及车道识别等技术保障行车安全与效率。面对数据处理、场景理解等挑战,未来技术将持续优化,深化智能驾驶体验,引领交通行业变革。
|
5月前
|
机器学习/深度学习 并行计算 算法
Ebsynth:利用图像处理和计算机视觉的视频风格转换技术工具
EbSynth 是一款基于视频风格转换技术的工具,专注于将静态艺术风格应用到视频中的每一帧,使视频具有独特的艺术效果。它利用图像处理和计算机视觉技术,将用户提供的参考图像或绘画风格转换为视频效果。
164 2
|
6月前
|
机器学习/深度学习 人工智能 监控
计算机视觉技术在安防领域的应用深度解析
【7月更文挑战第28天】计算机视觉技术作为人工智能领域的重要分支,在安防领域的应用前景广阔。通过不断提升技术性能和解决实际应用中的问题,计算机视觉技术将进一步提升安防工作的效率和准确性,为公共安全和社会稳定贡献更大的力量。
|
6月前
|
机器学习/深度学习 传感器 人工智能
高效能计算机视觉技术在工业自动化中的应用与发展
随着工业自动化的迅速发展,高效能计算机视觉技术正成为关键驱动力。本文探讨了计算机视觉在工业自动化中的重要性,以及其应用和未来发展趋势。通过深入分析现有技术和案例研究,展示了计算机视觉如何提升生产效率、质量控制和安全性,并展望了其在智能制造中的潜力。 【7月更文挑战第13天】
95 1
|
7月前
|
机器学习/深度学习 算法 计算机视觉
计算机视觉是一门研究如何使计算机“看”的技术,其目标是让计算机能够像人类视觉一样理解和解释视觉信息。
计算机视觉是一门研究如何使计算机“看”的技术,其目标是让计算机能够像人类视觉一样理解和解释视觉信息。