
暂无个人介绍
功能描述ClassifyingRubbish可以对图片中的物品垃圾进行分类,并给出具体的物品名称。 前提条件前往视觉只能开放平台开通图像识别服务。 图片限制图片类型:JPEG、JPG、PNG。图片大小:图片小于等于3M。图片分辨率:不限制图片分辨率,但图片分辨率太高可能会导致API识别超时,超时时间为5秒。URL地址中不能包含中文字符。 应用 干电池识别代码示例 "success": true, "data": { "data": { "RequestId": "62AB40DF-0DE2-43EF-BC6D-E49A4C731BCF", "Data": { "Sensitive": false, "Elements": [ { "Rubbish": "干电池", "Category": "干垃圾", "CategoryScore": 1, "RubbishScore": 1 } ] } }, "url": "https://imagerecog.cn-shanghai.aliyuncs.com/", "during": 661, "headers": { "response": { "date": "Tue, 03 Nov 2020 12:31:19 GMT", "content-type": "application/json;charset=utf-8", "content-length": "178", "connection": "keep-alive", "access-control-allow-origin": "*", "access-control-allow-methods": "POST, GET, OPTIONS", "access-control-allow-headers": "X-Requested-With, X-Sequence, _aop_secret, _aop_signature", "access-control-max-age": "172800", "x-acs-request-id": "62AB40DF-0DE2-43EF-BC6D-E49A4C731BCF" } } }, "requestId": "ec7732ba-b92c-4d2d-bd31-1a259fdcd43c" } 调试您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。 请求参数Action类型String,示例值ClassifyingRubbish 要执行的操作取值:ClassifyingRubbish。 ImageURL类型String是必选示例值:https://viapi-test.oss-cn-shanghai.aliyuncs.com/test-team/rubbish.jpg 描述图片URL地址。当前仅支持上海地域的OSS链接,如何生成URL请参见生成URL。 返回数据名称Data,类型Struct,描述返回的结果数据内容。名称RequestId,类型String,示例值UUID,描述请求ID。 示例代码请求示例 &ImageURL=https://viapi-test.oss-cn-shanghai.aliyuncs.com/test-team/rubbish.jpg &<公共请求参数> 正常返回数据 <Data> <Sensitive>false</Sensitive> <Elements> <Category>可回收垃圾</Category> <CategoryScore>0.68</CategoryScore> <Rubbish>干电池</Rubbish> <RubbishScore>0.68</RubbishScore> </Elements> </Data> 总结:基于个人水平不足,只能参考学习。经过这5天的学习对视觉只能AI识别有了系统的认识,也懂得了识别的原理与程序代码分析。收获良多。
步骤 一、开通对象存储OSS服务二、创建存储空间三、开通目标检测服务车辆损伤识别针对常见小汽车车型,识别车辆外观受损部件及损伤类型,可识别数十种车辆部件、五大类外观损伤。(刮擦、凹陷、开裂、褶皱、穿孔)RecognizeVehicleDamage函数可以检测图片中车辆损伤的位置以及类型。车险图片分类对输入的车险图片进行分类。ClassifyVehicleInsurance对输入的车险图片进行分类。可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。四、下载安装SDK包五、RAM授权六、开始本地调用
一.功能简介 对上传的图片进行表情分析,场景分析并分类。获取图片、获取分类,通过分类以及标签获取图片,通过分类获取图片列表以及上传文件。 二.项目结构 ● Application:启动的入口函数,● common:一般就是存放公共的类或者常量,或者枚举值● config:装载或者是数据库的配置● Controller:我们接收外部的请求,比如参数校验,之后通过接口调用或得到的数据返回给前端● Service: 把不同的请求 , 不同的服务把它抽象成一个 service,本项目有两个service,也可以认为是两个模块。● Utils: 存放公共的类或者工具函数。 总结:两个函数分别是表情识别,场景识别。本地上传储存储后端传输服务端分析,获取函数返回前端。实现轮播,分类,储存的功能
身份证识别系统 一. 简介:通过 spring-boot-starter 创建的一个 springboot项目,项目中主要文件的介绍如下:● Application:Spring-Boot 的一个启动类;● MainController:控制器层,负责模版的渲染、路由等功能;● OcrService:负责通过 SDK 调用视觉智能开放平台的 OCR 能力;● index.html:基于 thymeleaf 的前端模版;● application.properties:包含若干配置项的配置文件;● pom.xml:pom 依赖。二. 逻辑(1)前端:有一个标题、2 个表单、2 个上传文件的组件以及一个开始识别的按钮。用相应的代码实现其功能。在 input 组件限制了上传的图片类型,最前面设置了一个 alert,用于图片上传报错。上传时会把表达上传到 input 组件中,再把 input 中的内容传给form表单。代码主要两部分主要分为两部分:一是对上传的图片进行展示,二是对 OCR 识别出的信息进行展示,包括姓名、性别、民族、出生日期等信息。(2)控制层:要包括如下几部分:● 定义的若干个私有成员;● MainCntroller;● saveFile;● index;● uploadFile(3)OcrService有 4 个 私 有 变 量,ocrClient、runtime、accessKeyId 和 accessKeySecret,在设置好 request 之后,我们将 request 和 runtime 作为参数传递给 ocrClient 来调用身份证识别的方法,之后我们得到相应的 response,也就是识别的结果,之后我们将结果处理成哈希 Map 返回给控制层。(三). 搭建步骤1.官网获取视觉计划身份证识别SDK(示范:阿里云SDK)2.下载安装SDK包使用 pip 命令安装阿里云SDK核心库:pip install aliyun-python-sdk-core安装云产品的SDK。pip install aliyun-python-sdk-ecs安装文字识别,阿里云OCR服务pip install aliyun-python-sdk-ocr3.RAM授权4.编写程序并运行开始本地调用参考身份证识别接口文档,进行开发 总结:简单介绍了身份证识别系统的原理与搭建步骤
一、视觉生产的定义通过一个/一系列视觉过程,产出新的视觉表达。产出新的,和输入不一样的人或机器能够感知的图像视频,而不是标签或特征。二、视觉生产的分类三、视觉生产通用基础框架有请求,分发,服务,相应四大部分,基本框架如图四、视觉生产的五个关键维度带来用户/商业价值(可用)提供用户预期的抓手(可控)保证结果的丰富性(多样)合乎语义/内容逻辑(合理)满足视觉/美学表现(可看)为一个金字塔式由下至上五、精细理解,分割抠图识别:知道是什么检测:识别+知道在哪儿分割:识别+检测+每一个像素是什么六、模型框架,解题思路六、视觉生成框架流程其大概过程包括理需求、定草图、选状态、调细节、生成图、评好坏 6 个步骤七、视觉编辑有视频植入,视频内容擦除,画幅变化,图像尺寸变化与修旧如新视频植入:视频植入就是在视频中加入一些本来没有的内容视觉内容擦除:要从视频中擦除一些东西(精确)画幅变化:变化之后为了有完整的视觉效果,进行内容补全图像尺寸变化:图像尺寸的自动变化,方便应用于其他场景中修旧如新:视觉增强就是对视频的内容进行一些改变,以达到视频某些方面的改善效果。八、视觉增强(分辨率、帧率、色彩)人脸修复增强、渲染图超分、视频超分、插帧、HDR色彩扩展、风格迁移九、视觉制造实体设计制造、服装几何生成、多样性拓展等 总结:通过今天的学习,我学习到AI视觉的很多定义与相应的应用实例,了解了AI视觉的学习需要大量的数据训练、精确的模型识别。
2020年11月
2020年10月