Class 1 达摩院视觉AI技术应用探索

简介: 阿里云高校计划视觉AI五天训练营教程

打卡截图:

一、视觉生产——定义

通过一个/一系列视觉过程,产出新的视觉表达。
产出:人或机器能够感知的图像视频,而不是标签或特征;
要求:新的,和输入不一样的。
输入(参数/素材)——>过程(视觉生产)——>产出(素材/成品)

二、视觉生产——分类

1.生成:从0到1
2.拓展:从1到N
3.摘要:从N到1
4.升维:从An到An+1(比如2D到3D,静态到动态等)
5.增强/变换:从A到B(改)
6.插入/合成:A+B=C(增)
7.擦除:A-B=C(删)

三、视觉生产——通用基础框架

(请求)输入(参数、素材等)
(分发)生产类型(通用生成、素材合成等)
(服务)视觉生产引擎(生成引擎、搜索引擎)
(响应)输出图像/视频/3D(素材、案例等)

四、视觉生产——五个关键维度(由下至上,由浅入深)

  • 带来用户/商业价值(可用)
  • 提供用户预期的抓手(可控)
  • 保证结果的丰富性(多样)
  • 合乎语义/内容逻辑(合理)
  • 满足视觉/美学表现(可看)

五、精细理解——分割抠图

识别:知道是什么
检测:识别+知道在哪儿
分割:识别+检测+每一个像素是什么

六、视觉生成——框架流程

1.理需求
2.定草图
3.选状态
4.调细节
5.生成图
6.评好坏

素材准备——基础特——智能特效——智能编排

七、视觉编辑






视觉植入:可实现在视频里进行文字、图片的拼接插入或者删除
画幅变化:调整画幅比例、图片尺寸等
八、视觉增强(分辨率、帧率、色彩)



人脸修复增强、渲染图超分、视频超分、插帧、HDR色彩扩展、风格迁移

九、视觉制造


实体设计制造、服装几何生成、多样性拓展等

十、视觉智能开放平台

视觉开放平台

相关文章
|
1天前
|
存储 机器学习/深度学习 人工智能
RAG:AI大模型联合向量数据库和 Llama-index,助力检索增强生成技术
RAG:AI大模型联合向量数据库和 Llama-index,助力检索增强生成技术
RAG:AI大模型联合向量数据库和 Llama-index,助力检索增强生成技术
|
1天前
|
机器学习/深度学习 人工智能 安全
用AI技术创业需要哪些技能?
人工智能(AI)技术作为当今科技创新的前沿领域,为创业者提供了广阔的机会和挑战。随着AI技术的快速发展和应用领域的不断拓展,未来AI技术方面会有哪些创业机会呢? 创什么业打工才是程序员的主旋律,没有资源没有人脉怎么创业。
10 0
|
1天前
|
机器学习/深度学习 人工智能 搜索推荐
未来AI技术在医疗领域可能带来的变革
【5月更文挑战第7天】未来AI技术在医疗领域可能带来的变革
17 5
|
1天前
|
人工智能 自然语言处理 搜索推荐
AI在医疗领域的应用有哪些?
【5月更文挑战第7天】AI在医疗领域的应用有哪些?
30 6
|
2天前
|
机器学习/深度学习 存储 人工智能
构建未来:AI在持续学习系统中的应用
【5月更文挑战第6天】 随着人工智能技术的飞速发展,AI在各个领域中的应用越来越广泛。本文将探讨AI在持续学习系统中的应用,以及如何通过这种技术提高教育质量和效率。我们将讨论AI如何帮助个性化学习,提供实时反馈,以及如何通过数据分析预测学生的学习进度。此外,我们还将探讨AI在教育中的潜在挑战和解决方案。
10 3
|
4天前
|
人工智能 搜索推荐
【AI 生成式】描述生成式 AI 在医疗保健和药物发现中的应用
【5月更文挑战第4天】【AI 生成式】描述生成式 AI 在医疗保健和药物发现中的应用
|
4天前
|
机器学习/深度学习 人工智能 自然语言处理
【AI 生成式】强化学习如何应用于生成式 AI?
【5月更文挑战第4天】【AI 生成式】强化学习如何应用于生成式 AI?
|
4天前
|
机器学习/深度学习 人工智能 监控
【AI 场景】如何应用人工智能来增强企业网络的网络安全?
【5月更文挑战第4天】【AI 场景】如何应用人工智能来增强企业网络的网络安全?
|
5天前
|
传感器 人工智能 供应链
【AI 场景】如何应用 AI 来优化供应链管理
【5月更文挑战第3天】【AI 场景】如何应用 AI 来优化供应链管理
【AI 场景】如何应用 AI 来优化供应链管理
|
机器学习/深度学习 人工智能 算法