视觉Ai Day1笔记 视觉AI技术讲解

简介: 介绍了视觉ai技术的定义,基本原理与应用领域

一、视觉生产的定义
通过一个/一系列视觉过程,产出新的视觉表达。
产出新的,和输入不一样的人或机器能够感知的图像视频,而不是标签或特征。
1.png
二、视觉生产的分类2.png
三、视觉生产通用基础框架
有请求,分发,服务,相应四大部分,基本框架如图3.png
四、视觉生产的五个关键维度
带来用户/商业价值(可用)
提供用户预期的抓手(可控)
保证结果的丰富性(多样)
合乎语义/内容逻辑(合理)
满足视觉/美学表现(可看)
为一个金字塔式由下至上4.png
五、精细理解,分割抠图
识别:知道是什么
检测:识别+知道在哪儿
分割:识别+检测+每一个像素是什么
六、模型框架,解题思路5.png
六、视觉生成框架流程
其大概过程包括理需求、定草图、选状态、调细节、生成图、评好坏 6 个步骤
七、视觉编辑
有视频植入,视频内容擦除,画幅变化,图像尺寸变化与修旧如新
视频植入:视频植入就是在视频中加入一些本来没有的内容
视觉内容擦除:要从视频中擦除一些东西(精确)
画幅变化:变化之后为了有完整的视觉效果,进行内容补全
图像尺寸变化:图像尺寸的自动变化,方便应用于其他场景中
修旧如新:视觉增强就是对视频的内容进行一些改变,以达到视频某些方面的改善效果。
八、视觉增强(分辨率、帧率、色彩)
人脸修复增强、渲染图超分、视频超分、插帧、HDR色彩扩展、风格迁移
九、视觉制造
实体设计制造、服装几何生成、多样性拓展等

总结:通过今天的学习,我学习到AI视觉的很多定义与相应的应用实例,了解了AI视觉的学习需要大量的数据训练、精确的模型识别。

相关文章
|
4天前
|
人工智能 编解码 安全
[译][AI OpenAI-doc] 视觉
学习如何使用 GPT-4 来理解图像。具有视觉功能的 GPT-4 Turbo 允许模型接收图像并回答与之相关的问题。了解图像上传、处理、成本计算、模型限制等详细信息。
|
8天前
|
机器学习/深度学习 人工智能 算法
未来AI技术的发展与应用前景
随着人工智能(AI)技术的迅速发展,其在各个领域的应用前景备受关注。本文将探讨未来AI技术的发展趋势,以及其在医疗、交通、教育等领域的潜在应用,展望AI技术对未来社会的影响和改变。
17 1
|
10天前
|
机器学习/深度学习 算法 PyTorch
fast.ai 深度学习笔记(三)(3)
fast.ai 深度学习笔记(三)(3)
26 0
|
10天前
|
机器学习/深度学习 PyTorch 算法框架/工具
fast.ai 深度学习笔记(三)(1)
fast.ai 深度学习笔记(三)(1)
31 0
|
11天前
|
机器学习/深度学习 固态存储 Python
fast.ai 深度学习笔记(四)(2)
fast.ai 深度学习笔记(四)
45 3
fast.ai 深度学习笔记(四)(2)
|
11天前
|
机器学习/深度学习 算法框架/工具 PyTorch
fast.ai 深度学习笔记(五)(4)
fast.ai 深度学习笔记(五)
67 3
fast.ai 深度学习笔记(五)(4)
|
机器学习/深度学习 自然语言处理 Web App开发
fast.ai 深度学习笔记(五)(3)
fast.ai 深度学习笔记(五)
113 2
fast.ai 深度学习笔记(五)(3)
|
11天前
|
机器学习/深度学习 API 调度
fast.ai 深度学习笔记(六)(3)
fast.ai 深度学习笔记(六)
80 6
fast.ai 深度学习笔记(六)(3)
|
机器学习/深度学习 计算机视觉 存储
fast.ai 深度学习笔记(七)(4)
fast.ai 深度学习笔记(七)
83 8
fast.ai 深度学习笔记(七)(4)
|
11天前
|
机器学习/深度学习 自然语言处理 搜索推荐
fast.ai 深度学习笔记(二)(3)
fast.ai 深度学习笔记(二)
86 2
fast.ai 深度学习笔记(二)(3)