阿里云高校计划视觉AI五天训练营教程 Day 1
在这个人工智能已经普及的时代,各行各业都充斥着AI的身影。大部分人认为人工智能起点高,入门难,想要使用AI服务又无法独立完成编写,阿里云视觉平台是基于阿里巴巴视觉智能技术实践经验,面向视觉智能技术企业和开发商(含开发者),为其提供高易用、普惠的视觉API服务,帮助企业快速建立视觉智能技术的应用能力的综合性视觉AI能力平台。
开发者可以通过阿里云视觉平台提供的通用且标准化的接入方式,快速接入及使用阿里云视觉平台提供的包括人脸人体、文字识别、商品理解、内容安全、图像识别、图像生产、分割抠图、视觉搜索、目标检测、图像分析处理、视频理解、视频生产、视频分割13个类目多个API能力。
本期直播将带你实战讲述如何使用阿里云视觉平台API快速开发在线视觉AI平台,让你认为遥远的AI能力变得触手可及!
笔记
视觉生产技术探索与应用
视觉生产是什么?
通过一个/一系列视觉过程,产出新的视觉表达(人或机器能够感知的图像或视频,而非标签或特征)。
视觉生产的分类
生成——从0到1
拓展——从1到N
摘要——从N到1
升维——从$A_n$到$A_{n+1}$
增强/变换——从A到B
插入/合成——A+B=C
擦除——A-B=C
视觉生产的通用基础框架
请求——分发——服务——响应
视觉生产的五个关键维度
- 结果满足视觉和美学表现(可看)
- 结果合乎语义和内容逻辑(合理)
- 结果具有丰富性(多样)
- 提供用户预期的抓手(可控)
- 带来用户和商业价值(可用)
精细理解
分割抠图
目的:识别+检测
难点:……
解题思路、模型框架、效果展示、人像抠图拓展、场景抠图拓展
视觉生成——从无到有
鹿班(是视觉生成领域在业界落地的先行者,对外提供大规模在线的AI设计服务)、框架流程、鹿班电商设计、鹿班场景智能美工、鹿班行业设计、AlibabWood
视觉编辑——移花接木
视频内容擦除、文字擦除、logo擦除……
视觉增强——修旧如新
人脸修复增强、渲染图超分辨率、视频超分辨率、视频插帧、HDR色彩扩展、风格迁移、颜色拓展
视觉制造——由虚入实
包装几何生成、服装几何生成、视觉迁移及融合、多样性拓展、2D3D融合