视觉AI训练营

简介: **视觉生产技术** 定义和分类 精细理解 视觉生成 视觉编辑 视觉增强 视觉制造 视觉开发平台

# 视觉AI五天训练营Day1

视觉生产技术
定义和分类
精细理解
视觉生成
视觉编辑
视觉增强
视觉制造
视觉开发平台

定义和分类
image.png
image.png
image.png
image.png

精细理解——寻微入里
分割抠图
image.png
image.png

视觉生成——从无到有
电商设计
视频生成
封面生成

视觉编辑——移花接木

视频植入
广告位检测
广告位跟踪
遮挡检测

视频内容擦除
文字擦除

去掉后期字幕
去掉原生文字

Logo擦除

去掉台标
去掉广告

画幅变化

裁剪
补全

图像尺寸变化

视觉增强——修旧如新
视频增强
人脸修复增强
细节修复

渲染图超分
视频超分

视频插帧
HDR色彩扩展
风格迁移
视觉迁移
颜色拓展
image.png

视觉制造——由虚入实
几何生成
多样性拓展
2D3D融合
image.png

视觉开放平台

相关文章
|
18天前
|
人工智能 编解码 安全
[译][AI OpenAI-doc] 视觉
学习如何使用 GPT-4 来理解图像。具有视觉功能的 GPT-4 Turbo 允许模型接收图像并回答与之相关的问题。了解图像上传、处理、成本计算、模型限制等详细信息。
|
27天前
|
人工智能 编解码 安全
揭秘AI幻觉:GPT-4V存在视觉编码漏洞,清华联合NUS提出LLaVA-UHD
【4月更文挑战第14天】清华大学与新加坡国立大学团队针对大型多模态模型(LMMs)在处理高分辨率图像时的局限,提出新模型LLaVA-UHD。该模型通过图像模块化、压缩和空间模式组织策略,有效提升了处理任意比例和高分辨率图像的能力。实验显示,LLaVA-UHD在9个基准测试中超越现有模型,且在TextVQA任务上准确率提升6.4%,同时训练时间更短。然而,模型训练成本高、泛化能力待优化是未来需解决的问题。
32 8
揭秘AI幻觉:GPT-4V存在视觉编码漏洞,清华联合NUS提出LLaVA-UHD
|
29天前
|
人工智能 自然语言处理 Cloud Native
通义灵码×西安交通大学携手打造“云工开物-高校训练营”,解锁 AI 时代编程学习与实战
阿里云与西安交通大学计算机学院携手打造的“云工开物-高校训练营”,带你走近 AI 编程助手“通义灵码”。
|
2月前
|
人工智能 UED
“视觉AI任意门”AnyDoor,只需点两下鼠标就可以实现任意场景物体交换
【2月更文挑战第17天】“视觉AI任意门”AnyDoor,只需点两下鼠标就可以实现任意场景物体交换
104 1
“视觉AI任意门”AnyDoor,只需点两下鼠标就可以实现任意场景物体交换
|
2月前
|
机器学习/深度学习 人工智能 自然语言处理
探索无限:Sora与AI视频模型的技术革命 - 开创未来视觉艺术的新篇章
探索无限:Sora与AI视频模型的技术革命 - 开创未来视觉艺术的新篇章
61 1
|
2月前
|
机器学习/深度学习 人工智能 知识图谱
LeCun视觉世界模型论文,揭示AI学习物理世界的关键
【2月更文挑战第16天】LeCun视觉世界模型论文,揭示AI学习物理世界的关键
19 2
LeCun视觉世界模型论文,揭示AI学习物理世界的关键
|
4月前
|
机器学习/深度学习 存储 人工智能
如何在本地部署视觉AI系统呢
如何在本地部署视觉AI系统呢
|
4月前
|
存储 机器学习/深度学习 人工智能
视觉AI的公共云服务有哪些优势
视觉AI的公共云服务有哪些优势
|
4月前
|
人工智能 API 开发工具
视觉AI的公共云
视觉AI的公共云
|
10月前
|
机器学习/深度学习 存储 人工智能