定义和分类
视觉生产的定义
通过一个/一系列的视觉过程,产生出新的视觉表达
要求是和输入不一样的图像视频产出
视觉生产的分类
生产: 从0到1
拓展:从1到N
摘要:从N到1
升维:从An到An+1
增强/变换: 从A到B
插入/合成:A+B=C
擦除:A-B=C
视觉生产的五个关键维度
- 可看 满足视觉/美学表现
- 合理 合乎语义/内容逻辑
- 多样 保证结果的丰富性
- 可控 提供用户预期的抓手
- 可用 带来用户/商业的价值
精细理解
分割抠图
- 识别
- 检测
- 分割
分割抠图难点
- 复杂背景、遮挡、发丝精扣、边缘反色、透明材质、多尺度/目标
- 数据严重不足,标注成本高
分割抠图模型框架
1.mask粗分割
2.mask质量统一
3.精确到alpha
分割抠图应用场景
- 头发丝
- 相似背景
- 其他物体抠图
视觉生成
鹿斑
alibabawood
视觉编辑
视频植入
视频内容擦除
视频画幅变化
视觉增强
- 人脸视觉增强
- 视频超分
- 视频插帧
- HDR色彩扩展
- 风格迁移
- 颜色拓展