阿里云高校计划视觉AI五天训练营 Day01 学习笔记

简介: 打卡

视觉生产技术探索与应用

  • 视觉生产定义

​ 视觉生产定义,分为两类视觉理解和视觉产生,视觉理解就是常见的检测,分割,而视觉产生可以理解为如何产生视觉,即通过一个、一系列视觉过程,产出新的视觉表达。在这里的产出,指的是和输入不一样的人或机器能感知到的视频,而不是标签或特征。

​ 视觉生产有以下分类,生成,拓展,摘要,升维,增强/变换,插入合成,擦除

  • 视觉生产通用基础框架

1.png

  • 视觉生产的五个维度

1.满足视觉/美学表现(可看)

2.合乎语义/内容逻辑(合理)

3.保证结果的丰富性(多样)

4.提供用户预期的抓手(可控)

5.带来商业价值和用户(可用)

  • 精细理解

1.识别:知道是什么

2.理解:再识别基础上知道位置信息

3.分割:在前两步的基础上知道没一个像素是什么(难点:复杂背景,遮挡,发丝精扣,边缘反色,透明材质,多尺度/目标)

思路1.复杂问题拆解:超mask估计+精准matting

​ 2.丰富数据样本:设计图像mask统一模型

2.png

  • 视觉生成流程
    3.png
  • 短视频流程

4.png

  • 视觉编辑

主要是对于视频进行增删改查,来优化用户的体验,应用主要如下:

5.png
6.png
7.png
8.png

  • 视觉增强

9.png

  • 视觉制造

10.png

  • 阿里云智能开放平台
    13.png
相关文章
|
3天前
|
人工智能 编解码 安全
[译][AI OpenAI-doc] 视觉
学习如何使用 GPT-4 来理解图像。具有视觉功能的 GPT-4 Turbo 允许模型接收图像并回答与之相关的问题。了解图像上传、处理、成本计算、模型限制等详细信息。
|
18天前
招募!阿里云x魔搭社区发起Create@AI创客松邀你探索下一代多维智能体应用
招募!阿里云x魔搭社区发起Create@AI创客松邀你探索下一代多维智能体应用
290 0
|
2月前
|
人工智能 运维 Kubernetes
阿里云容器服务ACK AI助手正式上线带来的便利性
作为开发者想必大家都知道,云原生容器技术的优势,尤其是近两年的随着容器技术的迅猛发展,Kubernetes(K8s)已成为广泛应用于容器编排和管理的领先解决方案,但是K8s的运维复杂度一直是挑战之一。为了应对这一问题,就在最近,阿里云容器服务团队正式发布了ACK AI助手,这是一款旨在通过大模型增强智能诊断的产品,旨在帮助企业和开发者降低Kubernetes(K8s)的运维复杂度。那么本文就来详细讲讲关于这款产品,让我们结合实际案例分享一下K8s的运维经验,探讨ACK AI助手能否有效降低K8s的运维复杂度,并展望ACK AI助手正式版上线后的新功能。
269 2
阿里云容器服务ACK AI助手正式上线带来的便利性
|
12天前
|
人工智能 编解码 安全
揭秘AI幻觉:GPT-4V存在视觉编码漏洞,清华联合NUS提出LLaVA-UHD
【4月更文挑战第14天】清华大学与新加坡国立大学团队针对大型多模态模型(LMMs)在处理高分辨率图像时的局限,提出新模型LLaVA-UHD。该模型通过图像模块化、压缩和空间模式组织策略,有效提升了处理任意比例和高分辨率图像的能力。实验显示,LLaVA-UHD在9个基准测试中超越现有模型,且在TextVQA任务上准确率提升6.4%,同时训练时间更短。然而,模型训练成本高、泛化能力待优化是未来需解决的问题。
21 8
揭秘AI幻觉:GPT-4V存在视觉编码漏洞,清华联合NUS提出LLaVA-UHD
|
1月前
|
存储 人工智能 自然语言处理
“智能+”时代,深维智信如何借助阿里云打造AI内容生成系统
随着数字经济的发展,线上数字化远程销售模式越来越成为一种主流,销售流程也演变为线上视频会议、线下拜访等多种方式的结合。根据Gartner报告,到2025 年60%的B2B 销售组织将从基于经验和直觉的销售转变为数据驱动的销售,将销售流程、销售数据、销售分析合并形成一致的运营实践。
405 0
“智能+”时代,深维智信如何借助阿里云打造AI内容生成系统
|
1月前
|
云安全 人工智能 安全
|
1月前
|
人工智能 UED
“视觉AI任意门”AnyDoor,只需点两下鼠标就可以实现任意场景物体交换
【2月更文挑战第17天】“视觉AI任意门”AnyDoor,只需点两下鼠标就可以实现任意场景物体交换
75 1
“视觉AI任意门”AnyDoor,只需点两下鼠标就可以实现任意场景物体交换
|
1月前
|
机器学习/深度学习 人工智能 自然语言处理
探索无限:Sora与AI视频模型的技术革命 - 开创未来视觉艺术的新篇章
探索无限:Sora与AI视频模型的技术革命 - 开创未来视觉艺术的新篇章
59 1
|
1月前
|
机器学习/深度学习 人工智能 知识图谱
LeCun视觉世界模型论文,揭示AI学习物理世界的关键
【2月更文挑战第16天】LeCun视觉世界模型论文,揭示AI学习物理世界的关键
18 2
LeCun视觉世界模型论文,揭示AI学习物理世界的关键
|
1月前
|
人工智能
阿里云AI作画工具免费体验
阿里云AI作画工具免费体验
206 0

热门文章

最新文章