阿里云高校计划视觉AI五天训练营教程 Day 1

简介: 阿里云高校计划视觉AI五天训练营教程 Day 1 - 视觉生成技术(打卡:1/5)内容大纲:1. 定义和分类2. 精细理解3. 视觉生成4. 视觉编辑5. 视觉增强6. 视觉制造7. 视觉开放平台

1、视觉生产

定义

image.png

生产过程:

image.png

趋势:AI替代人工

分类:

image.png

通用基础框架:

image.png

搜索引擎生成:

直接生成困难时,寻找相似图片,整合出新的图

五个 关键维度:

保证一个较好的视觉生产效果
image.png

2、精细理解:

唯有理解(图片内容)方能生产(新的图像)
(理解是生产的前提)
(智能分割抠图->有效理解)
image.png

难度:

(实际应用图片中的)
image.png

解决思路:

分割解题思路: 在这里插入图片描述
处理透明度、边缘精细度等
过程:Mask粗分割->质量统一->估算精确alpha
实践效果:发丝级精度;(对主体)镂空细节完整;(背景与主体)复杂相似处理物体抠图拓展:动物、动画、天空……
image.png

3、从无到有:

鹿班:

视觉生成领域在业界落地的先行者,对外提供大规模在线的AI设计服务.

框架流程:

image.png
调查用户需求(可控性)批量产图调整

应用:电商

  • 图生图:生成一个与给出的样式图差不多的图;
  • 短视频生成:根据视频内容、语境语义、风格生成视频摘要合成/封面生成;
    image.png

4、视觉编辑

移花接木

增删查改(带来更好的体验)

视频植入

image.png
增:广告插入
image.png
删:擦除
image.png
改:画幅长宽比变化+智能充填

5、视觉增强:

image.png

修旧如新高清化、人脸修复增强、渲染图、插帧、HDR色彩拓展

  • 风格迁移 (技术指向具体应用)
    image.png
  • 颜色拓展
    image.png

6、视觉制造 - 由虚入实

核心逻辑(实体设计制造)

image.png

服装几何生成、纹理图案迁移(3D)、视觉迁移及融合、多样性拓展、2D 3D背景融合

7、视觉开放平台

定位:

image.png

能力分布

image.png

特点

image.png

一站式能力

image.png

目录
相关文章
|
3天前
|
人工智能 编解码 安全
[译][AI OpenAI-doc] 视觉
学习如何使用 GPT-4 来理解图像。具有视觉功能的 GPT-4 Turbo 允许模型接收图像并回答与之相关的问题。了解图像上传、处理、成本计算、模型限制等详细信息。
|
17天前
招募!阿里云x魔搭社区发起Create@AI创客松邀你探索下一代多维智能体应用
招募!阿里云x魔搭社区发起Create@AI创客松邀你探索下一代多维智能体应用
284 0
|
1月前
|
机器学习/深度学习 编解码 人工智能
阿里云Stable Diffusion操作教程
阿里云Stable Diffusion操作教程
197 0
|
1月前
|
SQL 弹性计算 安全
购买阿里云活动内云服务器之后设置密码、安全组、增加带宽、挂载云盘教程
当我们通过阿里云的活动购买完云服务器之后,并不是立马就能使用了,还需要我们设置云服务器密码,配置安全组等基本操作之后才能使用,有的用户还需要购买并挂载数据盘到云服务器上,很多新手用户由于是初次使用阿里云服务器,因此并不知道这些设置的操作流程,下面给大家介绍下这些设置的具体操作流程。
购买阿里云活动内云服务器之后设置密码、安全组、增加带宽、挂载云盘教程
|
1月前
|
SQL 关系型数据库 MySQL
2024年阿里云数据库创建_数据库账号密码和连接教程
阿里云数据库怎么使用?阿里云百科整理阿里云数据库从购买到使用全流程,阿里云支持MySQL、SQL Server、PostgreSQL和MariaDB等数据库引擎,阿里云数据库具有高可用、高容灾特性,阿里云提供数据库备份、恢复、迁移全套解决方案。详细阿里云数据库购买和使用流程方法如下
|
1月前
|
SQL 关系型数据库 MySQL
阿里云MySQL数据库价格、购买、创建账号密码和连接数据库教程
阿里云数据库使用指南:购买MySQL、SQL Server等RDS实例,选择配置和地区,完成支付。创建数据库和账号,设置权限。通过DMS登录数据库,使用账号密码访问。同地域VPC内的ECS需将IP加入白名单以实现内网连接。参考链接提供详细步骤。
369 3
|
1月前
|
弹性计算 运维 安全
2024年阿里云上自建Palworld/幻兽帕鲁服务器教程
对于深爱《幻兽帕鲁》的玩家们,能够与好友共同联机探索游戏的奇幻世界,无疑是提升游戏体验的一大乐趣。但如何迅速且有效地搭建一个稳定且高效的联机服务器呢?今天,我们就来为大家分享一个详细的教程,让你轻松掌握自建《幻兽帕鲁》服务器的方法,让联机游戏之旅更加顺畅。
1416 4
|
11天前
|
人工智能 编解码 安全
揭秘AI幻觉:GPT-4V存在视觉编码漏洞,清华联合NUS提出LLaVA-UHD
【4月更文挑战第14天】清华大学与新加坡国立大学团队针对大型多模态模型(LMMs)在处理高分辨率图像时的局限,提出新模型LLaVA-UHD。该模型通过图像模块化、压缩和空间模式组织策略,有效提升了处理任意比例和高分辨率图像的能力。实验显示,LLaVA-UHD在9个基准测试中超越现有模型,且在TextVQA任务上准确率提升6.4%,同时训练时间更短。然而,模型训练成本高、泛化能力待优化是未来需解决的问题。
21 8
揭秘AI幻觉:GPT-4V存在视觉编码漏洞,清华联合NUS提出LLaVA-UHD
|
13天前
|
弹性计算 人工智能 数据挖掘
阿里云高校计划“云工开物”解读,适合学生及高校教师参考
阿里云推出“云工开物”高校计划,向学生和教师提供优惠,旨在支持高等教育和培养科技人才。学生通过学信网认证可获300元优惠券和3折云服务器优惠;教师享5折全线产品折扣。此外,还有“极速上云”活动和各类挑战赛,促进实践和创新。
阿里云高校计划“云工开物”解读,适合学生及高校教师参考
|
22天前
|
弹性计算 关系型数据库 MySQL
阿里云数据库服务器价格表,数据库创建、连接和使用教程
阿里云数据库使用流程包括购买和管理。选择所需数据库类型如MySQL,完成实名认证后购买,配置CPU、内存和存储。确保数据库地域与ECS相同以允许内网连接。创建数据库和账号,设置权限。通过DMS登录数据库,使用账号密码连接。同一VPC内的ECS需添加至白名单以进行内网通信。参考官方文档进行详细操作。
125 3