视觉生产
通过一个或一系列视觉过程,产生新的视觉表达。
分类:
生成:从0到1
拓展:从1到N
摘要:从N到1
升维:从An到An+1(如2D到3D)
增强/变换:从A到B
插入/合成:A+B=C
擦除:A-B=C
通用框架
(请求)输入(参数、素材等)
(分发)生产类型(通用生成、素材合成等)
(服务)视觉生产引擎(生成引擎、搜索引擎)
(响应)输出图像/视频/3D(素材、案例等)
精细理解
视觉分割是生产的必要前置步骤,唯有理解方能生成。
(理解是生产的前提)
(智能分割抠图->有效理解)
识别:知道是什么
检测:识别+知道在哪里
分割:识别+检测+知道每一个像素是什么
视觉生成
框架流程:理需求-定草图-选状态-调细节-生成-评价
视频生成:根据视频内容、语境语义、风格生成视频摘要合成/封面生成
视觉编辑
增删查改
视频植入、植入位检测与定位
调整画幅比例、图片尺寸等
视觉增强
人脸修复增强、渲染图超分、视频超分、视频插帧、HDR色彩扩展、风格迁移,去噪声
视觉制造
由虚入实、服装几何生成、纹理图案迁移、3D、背景融合,流行色、多样性拓展
视觉智能开放平台
vision.aliyun.com