视觉AI训练营——Day1

简介: 记录今日内容

什么是视觉生产?

通过一个/一系列视觉过程,产出新的视觉表达。
产出:人或机器能够感知的图像视频,而不是标签或特征;
要求:新的,和输入不一样的!
image.png

视觉生产的分类

  • 生成:从0到1
  • 拓展:从1到N
  • 摘要:从N到1
  • 升维:从An到An+1

视觉生产的通用框架

主要分成4个部分:请求,分发,服务,相应
image.png

视觉生产的五个关键维度

1.满足视觉/美学表现
2.合乎语义/内容逻辑
3.保证结果的丰富性
4.提供用户预期的抓手
5.带来用户/商业价值

进一步理解

1.识别

知道是什么

2.检测

识别+知道在哪儿

3.分割

识别+检测+知道每一个像素是什么
难点:数据严重不足,标注成本高

思路:
1、复杂问题拆解:粗mask估计+精准matting
2、丰富数据样本:设计图像mask统一模型

效果图

image.png

视觉生成——无到有

视觉生成——鹿班

鹿班是视觉生成领域在业界落地的先行者,对外提供大规模在线的Al设计服务

视觉生成的流程

1.理需求

2.定草图
3.选状态
4.调细节
5.生成图
6.好评坏

视频编辑——移花接木

视频植入

1.挖掘视频,核心价值部分
2.扩大植入,珈盖范围
3.提升植入,效果效率

视频编辑

擦除不要的内容

视觉增强——修旧如新

视频增强

生成对抗技术与图像翻译技术相融合

大规模虚拟数据生成与真实数据交叉训练
隐式光流计算与多帧特征融合提升时域稳定性

效果图

image.png

视觉增强——风格迁徙

经过SOTA显著性检测算法(SalGAN)验证,该算法有效提升了风格迁移的Attention Consistency。

视觉迁徙——颜色扩展

即通过算法改变颜色

视觉制造——由虚入实

实体设计制造现状

·效率低:多次打样,多次沟通(服装设计平均30天)

·定制难:无法实现柔性生产
·协同差:设计、营销、生成脱节、倒置

目前使用后视觉AI后流程

1.输入
2.生成
3.多样
4.生产

总结

随着AI的势头持续高涨,AI在智能视觉系统中的应用呈现出非常光明的未来。在硬件方面,已经出现了专用处理器;在软件方面,有越来越强大的算法,能够识别物体、面部和姿势。从AI的市场应用方面看,首先是智能家居和智能安防市场;第二是用于个人身份认证(解锁、支付)的手机安全系统;最后是生物特征识别及其在智能建筑和智慧城市中的应用。AI领域涌现出了大量的投资、收购和合作关系,而且在未来的几年内市场规模将相当可观,市场和收入都将快速增长。

目录
相关文章
|
3天前
|
人工智能 编解码 安全
[译][AI OpenAI-doc] 视觉
学习如何使用 GPT-4 来理解图像。具有视觉功能的 GPT-4 Turbo 允许模型接收图像并回答与之相关的问题。了解图像上传、处理、成本计算、模型限制等详细信息。
|
12天前
|
人工智能 编解码 安全
揭秘AI幻觉:GPT-4V存在视觉编码漏洞,清华联合NUS提出LLaVA-UHD
【4月更文挑战第14天】清华大学与新加坡国立大学团队针对大型多模态模型(LMMs)在处理高分辨率图像时的局限,提出新模型LLaVA-UHD。该模型通过图像模块化、压缩和空间模式组织策略,有效提升了处理任意比例和高分辨率图像的能力。实验显示,LLaVA-UHD在9个基准测试中超越现有模型,且在TextVQA任务上准确率提升6.4%,同时训练时间更短。然而,模型训练成本高、泛化能力待优化是未来需解决的问题。
21 8
揭秘AI幻觉:GPT-4V存在视觉编码漏洞,清华联合NUS提出LLaVA-UHD
|
1月前
|
人工智能 UED
“视觉AI任意门”AnyDoor,只需点两下鼠标就可以实现任意场景物体交换
【2月更文挑战第17天】“视觉AI任意门”AnyDoor,只需点两下鼠标就可以实现任意场景物体交换
75 1
“视觉AI任意门”AnyDoor,只需点两下鼠标就可以实现任意场景物体交换
|
1月前
|
机器学习/深度学习 人工智能 自然语言处理
探索无限:Sora与AI视频模型的技术革命 - 开创未来视觉艺术的新篇章
探索无限:Sora与AI视频模型的技术革命 - 开创未来视觉艺术的新篇章
59 1
|
1月前
|
机器学习/深度学习 人工智能 知识图谱
LeCun视觉世界模型论文,揭示AI学习物理世界的关键
【2月更文挑战第16天】LeCun视觉世界模型论文,揭示AI学习物理世界的关键
18 2
LeCun视觉世界模型论文,揭示AI学习物理世界的关键
|
3月前
|
机器学习/深度学习 存储 人工智能
如何在本地部署视觉AI系统呢
如何在本地部署视觉AI系统呢
|
3月前
|
存储 机器学习/深度学习 人工智能
视觉AI的公共云服务有哪些优势
视觉AI的公共云服务有哪些优势
|
3月前
|
人工智能 API 开发工具
视觉AI的公共云
视觉AI的公共云
|
9月前
|
机器学习/深度学习 存储 人工智能
|
9月前
|
人工智能 智能设计 达摩院