视觉AI技术应用探索学习笔记-阿里云开发者社区

开发者社区> 人工智能> 正文
登录阅读全文

视觉AI技术应用探索学习笔记

简介: 第一天-应用探索学习笔记

定义

通过一个/一系列视觉过程,产生新的视觉表达

image-20200924091138037

分类

  • 生成:从0到1
  • 扩展:从1到N
  • 摘要:从N到1(把主要的信息浓缩起来)
  • 升维:从An到An+1
  • 增强/变换:从A到B
  • 插入/合成: A+B = C
  • 擦除: A-B=C

基础通用框架

image-20200924091900976

五个关键维度

视觉生产要满足5个规范要求才是一个好的视觉

  1. 满足视觉,美学表现符合人们的审美
  2. 合乎语义,内容逻辑
  3. 保证结果的丰富性
  4. 提供用户预期的抓手,让用户可以添加一些控制因素
  5. 要具有商业价值

精细理解-分割抠图

  1. 识别:知道是什么
  2. 检测:识别+知道在哪儿(缺陷检测,多目标检测)
  3. 分割:识别+检测+知道每个像素是什么(全景分割,病灶分割)(视觉分割时生产的必要前置步骤)

分割抠图难点

  • 复杂背景
  • 遮挡
  • 发丝精抠
  • 边缘反色
  • 多尺度/目标
  • 数据不足

分割思路

思路

  1. 复杂问题拆解:mask估计+精准matting
  2. 丰富数据样本:设计图像mask同一模型

类型

  • 语义分割(Semantic Segmentation):分析出事什么东西,比如是个人
  • 实例分割(Instance Segmentation):分析出这个人是谁
  • 图像抠图技术(Image Matting):处理图像

image-20200924103243394

模型框架

image-20200924093747005

从无到有

鹿班

功能:平面图像设计生成

框架流程

image-20200924101113146

AlibaabWood

功能:短视频设计生成

框架流程

image-20200924101352822

视频编辑-移花接木

应用方面

  • 视频植入
  • 动态监测分割
  • 视频内容擦除

    • 文字擦除
    • Logo擦除
  • 画幅变化
  • 图像尺寸变化

视觉增强-修旧如新

核心逻辑

image-20200924102101381

应用方面

  • 人脸修复增强
  • 渲染图超分
  • 视频超分
  • 视频插帧
  • HDR色彩扩展
  • 风格迁移
  • 颜色扩展

视觉制造-由虚入实

核心逻辑

image-20200924102502018

应用方面

  • 包装几何生成
  • 服装几何生成
  • 视觉迁移及融合
  • 多样性拓展
  • 2D3D融合

视觉智能开放平台

集合上面的一些视觉功能以及其他的功能,网址vision.aliyun.com

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

分享:
人工智能
使用钉钉扫一扫加入圈子
+ 订阅

了解行业+人工智能最先进的技术和实践,参与行业+人工智能实践项目

其他文章