视觉生产技术
定义和分类
定义:视觉分为视觉理解(检测分割)、视觉生产(产生视觉)。视觉生产是通过一个或者一系列视觉过程,产生新的视觉表达。
产出:人或机器能感知图像视频而不是标签或特征
要求:新的,和输入的不一样
分类:生成:从0到1、拓展:从1到N、摘要:从N到1、升维:从An到An+1、增强:从A到B、插入:A+B=C、擦除A-B=C
五个关键维度:
1.满足视觉表现
2.合乎语义逻辑
3.保证结果丰富
4.提供用户预期抓手
5.带来用户商业价值
精细理解
识别、检测、分割:理解整体、位置和每一个像素
分割抠图难点:复杂背景、遮挡、发丝、反色、透明材质、多材质
思路:问题拆解:mask估计+精准matting,丰富数据样本

视觉生成
照图生图:参考原图风格
个性化设计:多元化设计
平面生成、短视频生成:准备素材+基础、智能特效+编排
视频摘要:镜头分割、动作识别、镜头筛选、排序优化、视频合成
视频封面:图像增强+内容分析+质量审核+场景要求
视觉编辑

视频植入:扩展广告曝光渠道,扩大范围、提升植入效果
动态监测分割
视频内容擦除:字幕、台标、广告、文字、人体擦除,去掉后期、原生字幕

画幅变化:保留有效画面、内容不全
视觉增强
人脸增强、去噪声、通用场景超分、LDR升HDR、倍频、去划痕
视频插帧
HDR色彩扩展
风格迁移
视觉制造
包装几何生成
材质工艺
视觉迁移和融合
多样性拓展
2D3D融合
视觉开放平台