阿里云高校计划视觉AI五天训练营 Day1 视觉生产技术简介
1.视觉生产定义和分类
视觉生产的定义:通过一个/一系列视觉过程,产生新的视觉表达。
视觉生产的分类:
- 生产: 从0到1
- 拓展:从1到N
- 摘要:从N到1
- 升维:从An到An+1 (比如从二维到三维,从图片到视频)
- 增强/变换: 从A到B
- 插入/合成:A+B=C
- 擦除:C-A=B
视觉生产通用基础框架:
视觉生产的五个关键维度:
- 可看 满足视觉/美学表现
- 合理 合乎语义/内容逻辑
- 多样 保证结果的丰富性
- 可控 提供用户预期的抓手
- 可用 带来用户/商业的价值
2.精细理解
精细理解——分割抠图
1.识别:通过AI人工智能识别画面中所描述的是什么。是人?是物?
2.检测:识别画面中的场景在哪?
3.分割:识别+检测,精准的分别物和场景,知道每一个像素是什么。
分割抠图——难点
- 复杂背景
- 遮挡
- 发丝精扣
- 边缘反色
- 透明材质
- 多尺度/目标
主要难点:数据严重不足,标注成本高
分割抠图——模型框架
3.视觉生成——从无到有
鹿班的框架流程(平面图片生产)
alibabawood框架流程(视频生成)
4.视频编辑——移花接木
视频内容植入
技术难点:在不干扰原本所表达内容的情况下合理的插入广告。
视频内容的擦除
视频画幅的变换
视觉增强——视频增强
视觉增强——人脸修复增强
精细化的修复人像,还原面部细节
5.视觉制造——由虚入实
目前实体制造产业所面临的问题:
1.效率低下:多次打样,多次沟通
2.协同差:设计,营销,产生脱节
3.定制难:无法实现柔性生产
核心逻辑
6.视觉智能开放平台
7.总结心得
第一天的内容主要介绍了视觉生产技术的概念以及阿里的视觉智能开放平台。展示了一系列通过人工智能生成的视觉产品。通过AI算法,实现了视觉产品的从无到有,由虚入实,增删改查。感受到了人工智能给视觉生产带来的快捷和便利。