阿里云高校计划视觉AI五天训练营 Day1 视觉生产技术简介

2020-10-30 664

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

本文涉及的产品

视觉智能开放平台，视频通用资源包5000点

视觉智能开放平台，分割抠图1万点

视觉智能开放平台，图像通用资源包5000点

简介： 第一天的内容主要介绍了视觉生产技术的概念以及阿里的视觉智能开放平台。展示了一系列通过人工智能生成的视觉产品。通过AI算法，实现了视觉产品的从无到有，由虚入实，增删改查。感受到了人工智能给视觉生产带来的快捷和便利。

阿里云高校计划视觉AI五天训练营 Day1 视觉生产技术简介

1.视觉生产定义和分类

视觉生产的定义：通过一个/一系列视觉过程，产生新的视觉表达。

截屏2020-10-30 下午3.24.03.png

视觉生产的分类：

生产：从0到1
拓展：从1到N
摘要：从N到1
升维：从An到An+1 （比如从二维到三维，从图片到视频）
增强/变换：从A到B
插入/合成：A+B=C
擦除：C-A=B

视觉生产通用基础框架：

截屏2020-10-30 下午5.11.23.png

视觉生产的五个关键维度：

可看满足视觉/美学表现
合理合乎语义/内容逻辑
多样保证结果的丰富性
可控提供用户预期的抓手
可用带来用户/商业的价值

2.精细理解

精细理解——分割抠图

1.识别：通过AI人工智能识别画面中所描述的是什么。是人？是物？

2.检测：识别画面中的场景在哪？

3.分割：识别+检测，精准的分别物和场景，知道每一个像素是什么。

分割抠图——难点

复杂背景
遮挡
发丝精扣
边缘反色
透明材质
多尺度/目标

主要难点：数据严重不足，标注成本高

分割抠图——模型框架

截屏2020-10-30 下午5.28.34.png

3.视觉生成——从无到有

鹿班的框架流程（平面图片生产）

截屏2020-10-30 下午5.34.51.png

alibabawood框架流程（视频生成）

截屏2020-10-30 下午5.38.27.png

4.视频编辑——移花接木

视频内容植入

截屏2020-10-30 下午5.40.06.png

技术难点：在不干扰原本所表达内容的情况下合理的插入广告。

视频内容的擦除

截屏2020-10-30 下午5.48.28.png

视频画幅的变换

截屏2020-10-30 下午6.02.01.png

视觉增强——视频增强

截屏2020-10-30 下午6.02.58.png

视觉增强——人脸修复增强

精细化的修复人像，还原面部细节

截屏2020-10-30 下午6.16.32.png

5.视觉制造——由虚入实

目前实体制造产业所面临的问题：

1.效率低下：多次打样，多次沟通

2.协同差：设计，营销，产生脱节

3.定制难：无法实现柔性生产

核心逻辑

截屏2020-10-30 下午6.24.42.png

6.视觉智能开放平台

截屏2020-10-30 下午6.27.29.png

7.总结心得

第一天的内容主要介绍了视觉生产技术的概念以及阿里的视觉智能开放平台。展示了一系列通过人工智能生成的视觉产品。通过AI算法，实现了视觉产品的从无到有，由虚入实，增删改查。感受到了人工智能给视觉生产带来的快捷和便利。

阿里云高校计划视觉AI五天训练营 Day1 视觉生产技术简介

阿里云高校计划视觉AI五天训练营 Day1 视觉生产技术简介

1.视觉生产定义和分类