视觉生产技术入门篇

简介: 视觉生产技术入门学习,什么是视觉生产?视觉生产分割抠图、视觉生成、视觉编辑、视觉增强、视觉制造等。

视觉生产技术

1. 定义和分类

1.1 视觉生产——定义

  • 视觉一般分为两大类

    • 视觉理解:检测、识别、分割等等
    • 视觉生产:怎么产生视觉【通过一个/一系列视觉过程,产出新的视觉表达】

      • 产出:人或机器能够感知的图像视频,而不是标签或特征
      • 要求:新的,和输入不一样的

在这里插入图片描述

1.2 视觉生产——分类

  • 生成:从0到1
  • 拓展:从1到N
  • 摘要:从N到1
  • 升维:从An到An+1
  • 增强/变换:从A到B
  • 插入/合成:A+B=C
  • 擦除:A-B=C

1.3 视觉生产——通用基础框架

在这里插入图片描述

1.4 视觉生产——五个关键维度

  1. 满足视觉/美学表现
  2. 合乎语义/内容逻辑
  3. 保证结果的丰富性
  4. 提供用户预期的抓手【可控】
  5. 带来用户/商业价值【可用】

在这里插入图片描述

2. 精细理解——寻微入里

人要先认知世界才能再改造世界

2.1 精细理解——分割抠图

  1. 识别:知道是什么

在这里插入图片描述

  1. 检测:识别 + 知道在哪儿

在这里插入图片描述

  1. 分割:识别 + 检测 + 知道每一个像素是什么

视觉分割是生产的必要前提步骤
唯能理解,方能生成

在这里插入图片描述

2.2 分割抠图——难点

  • 复杂背景
  • 遮挡
  • 发丝精抠、
  • 边缘反色
  • 透明材质、
  • 多尺度/目标

数据严重不足,标注成本高

2.3 分割抠图——解题思路

在这里插入图片描述

  1. 复杂问题拆解:粗mask设计 + 精准matting
  2. 丰富数据样本:设计图像mask统一模型

2.4 分割抠图——模型框架

在这里插入图片描述

2.5 分割抠图——人像抠图

在这里插入图片描述

2.6 分割抠图——物体抠图

在这里插入图片描述

由于每个图的细节等有所不同,所以想用一个model实现分割所有的图是不太可能的

2.7 分割抠图——场景抠图

在这里插入图片描述

3. 视觉生成——从无到有

3.1 视觉生成——框架流程

在这里插入图片描述
在这里插入图片描述

3.2 视觉生成——电商设计

  • 照图生图

    • 参考原图,将风格、布局等信息学习并迁移到目标数据上

在这里插入图片描述

  • 个性化设计

    • 多元化设计风格,结合商品品类、投放场景、目标客群的差异进行定制化设计

在这里插入图片描述

3.3 视觉生成——场景智能美工

  • IN:营销场景 + 原始素材
  • OUT:营销图片
  • 调用方式:API

在这里插入图片描述

3.4 视觉生成——AlibabaWood

在这里插入图片描述

3.5 视觉生成——框架流程

在这里插入图片描述

4. 视觉编辑——移花接木

4.1 视频植入

  • 目前大部分广告都是与内容无关的,对用户不太友好,视频植入手段可将广告植入到视频中,提升用户体验
    在这里插入图片描述

在这里插入图片描述

4.2 视觉编辑——植入位检测与定位

在这里插入图片描述

4.3 视觉编辑——动态检测分割

  • 单独分割
  • 遮挡关系等

4.4 视觉编辑——视频内容擦除

在这里插入图片描述

4.5 视觉编辑——文字擦除

在这里插入图片描述

4.6 视觉编辑——画幅变化

在这里插入图片描述
在这里插入图片描述

4.7 视觉编辑——图像尺寸变化

  • 在不同场合图像尺寸可以自动变化

在这里插入图片描述

5. 视觉增强——修旧如新

5.1 视觉增强——视频增强

在这里插入图片描述

5.2 视觉增强——人脸修复增强

  • 人脸是最重要的目标对象,对人像进行细节修复增强,有很重要的意义和价值
  • eg:老照片修复

在这里插入图片描述

5.3 视觉增强——渲染图超分

  • CG渲染时间几乎与图像分辨率成正比,高质量真实感渲染需要30分钟才能产生一张图像
  • 针对CG渲染流水线研发的超高分辨率技术可以把低分辨率图像放大到与高清原图一样的清晰度
    在这里插入图片描述

5.4 视觉增强——HDR色彩扩展

在这里插入图片描述

5.5 视觉增强——风格迁移

在这里插入图片描述

5.5 视觉增强——颜色拓展

在这里插入图片描述
在这里插入图片描述

6. 视觉制造——由虚入实

6.1 实体设计制造

  • 效率低:多次打样,多次沟通
  • 协同差:设计、营销、生成脱节、倒置
  • 定制难:无法实现柔性生产

在这里插入图片描述

6.2 视觉制造——核心逻辑

在这里插入图片描述

6.3 视觉制造——几何生成

  • 包装几何生成

在这里插入图片描述

  • 服装几何生成

在这里插入图片描述

6.4 视觉增强——材质工艺

在这里插入图片描述

6.5 视觉增强——视觉迁移及融合

在这里插入图片描述

6.6 视觉制造——多样性拓展

在这里插入图片描述

6.7 视觉制造——2D 3D融合

在这里插入图片描述

7. 视觉开放平台——万剑归宗

  • 官网:vision.aliyun.com

在这里插入图片描述

目录
相关文章
|
1月前
|
机器学习/深度学习 算法 开发工具
视觉智能平台常见问题之其他算法定制化开发如何解决
视觉智能平台是利用机器学习和图像处理技术,提供图像识别、视频分析等智能视觉服务的平台;本合集针对该平台在使用中遇到的常见问题进行了收集和解答,以帮助开发者和企业用户在整合和部署视觉智能解决方案时,能够更快地定位问题并找到有效的解决策略。
27 1
|
2月前
|
人工智能 自然语言处理
淘宝设计2023年度AI设计实践报告(上)
淘宝设计2023年度AI设计实践报告(上)
131 1
|
2月前
|
人工智能 双11
淘宝设计2023年度AI设计实践报告(中)
淘宝设计2023年度AI设计实践报告(中)
93 3
|
2月前
|
数据采集 人工智能 自然语言处理
淘宝设计2023年度AI设计实践报告(下)
淘宝设计2023年度AI设计实践报告(下)
120 1
|
8月前
|
人工智能 机器人
AI智能自动交易量化机器人系统开发稳定版丨案例设计丨方案项目丨功能分析丨源码说明
When developing an AI automated quantitative trading robot system, it is first necessary to clarify the system's goals and requirements. Determine key factors such as the market, trading strategy, and risk control methods to be traded. Next, establish the basic framework for data acquisition and pro
|
8月前
|
人工智能 机器人 中间件
对冲量化智能AI机器人炒币系统开发(现在案例)部署搭建
透明度是一件好事,但并非总是如此。有时用户需要一些隐私
|
10月前
|
存储 人工智能 物联网
AI数字人无人直播/真人直播系统开发详细功能/方案设计/案例部署/源码设计
  区块链、人工智能、数字孪生、人机交互、物联网等面向数据的新一代信息技术的演进并非偶然,而是从Web2.0向Web3.0演进的技术准备。从技术上来看,元宇宙是基于Web3.0技术体系和运作机制支撑下的可信数字化价值交互网络,是以区块链为核心的Web3.0数字新生态。元宇宙是以区块链为核心的Web3.0技术体系支撑下的新场景、新产业和新生态,将会在数字环境下催生大量创新商业模式,形成数字空间新范式。
|
人工智能 搜索推荐 物联网
如何用AI大模型升级升级产品
众所周知,从去年到今年,AI领域出现井喷版的火热景象,越来越多的基于AI大模型诞生的应用越来越多,功能也越来越强大。就拿传统的搜索引擎企业来讲,也不得不迅速加入到AI大模型开发的队伍中,以求提升自身搜索产品的功能升级。无论是国内还是国外,被chatGPT直接影响到的行业都在打造自己的AI大模型,为的就是跟上技术发展的脚步,使得自身产品能够保持持续的竞争力。
288 1
如何用AI大模型升级升级产品
|
传感器 机器学习/深度学习 人工智能
[OpenVI-视觉生产系列之视频稳像实战篇]再见吧云台,使用AI“魔法”让视频稳定起来
随着自媒体与短视频的兴起,人们有了越来越多的拍摄视频的需求。然而由于手持拍摄、硬件限制等原因,利用手机等普通摄影设备拍摄的视频难免存在视频抖动问题。尤其是开启较高倍数的变焦后,手持拍摄很难拍摄到稳定的视频,极易产生抖动的现象。使用云台、斯坦尼康等外设可以缓解这样的抖动,但是很多时候多带一个外设降低了拍摄视频的便利程度,会使得随时随地的拍摄体验大打折扣。
476 0
[OpenVI-视觉生产系列之视频稳像实战篇]再见吧云台,使用AI“魔法”让视频稳定起来
|
机器学习/深度学习 人工智能 资源调度

热门文章

最新文章