阿里云高校计划视觉AI五天训练营教程 Day 1

简介: 阿里云高校计划视觉AI五天训练营教程 Day 1

视觉生产技术

一、定义和分类

定义:通过一个/一系列视觉过程,产出新的视觉表达
产出:人或机器 能够感知的图像视频,而不是标签和物证
要求:新的和输入的不一样
分类:从0到1
拓展:从1到N
摘要:从N到1
升维:从An到An+1

增强/变换:从A到B
插入/合成:A+B=C
擦除:A-B=C

通用基础框架
输入(请求 Request)
生产类型(分发 Dispatch)
视觉生产引擎(服务Service)
输出 图像/视频/3D(响应Response)
五个关键维度
1、满足视觉/美学表现{可看}
2、合乎语义/内容逻辑{合理}
3、保证结果的丰富性{多样}
4、提供用户预期的抓手{可控}
5、带来用户/商业价格{可用}

二、精细理解-寻微入里

1、识别 知道是什么

2、检测 识别+知道在哪儿

3、分割: 识别+检测+知道每一个像素是什么

分割抠图-难点
复杂背景、遮挡、发丝精抠、边缘反色、透明材质、多尺度/目标

分割抠图-解题思路
1、复杂问题拆解:粗mask估计+精准matting
2、丰富数据样本:设计图像mask统一模型

分割抠图-模型框架
1、mask粗分割
2、mask质量统一
3、估计精确alpha
在这里插入图片描述
分割抠图-效果展示
在这里插入图片描述
分割抠图-人像抠图拓展
在这里插入图片描述
分割抠图-物体抠图拓展
细节部分处理
在这里插入图片描述
分割抠图-场景抠图拓展
在这里插入图片描述

3、视觉生成-从无到有

视觉生成-鹿班
平面图像设计生成
鹿班是视觉生成领域在业界落地的先行者,对外提供大规模在线的AI设计服务;
视觉生成——框架流程
在这里插入图片描述
视觉生成-鹿班电商设计
照图生图:参考原图,将风格、布局等信息学习并迁移到目标数据上;
个性化设计:多元化设计风格,结合商品品类、投放场景、目标客群的差异设计订制化设计

视觉生成-鹿班场景智能美工
在这里插入图片描述
鹿班在各行业中的应用
视频、娱乐、母婴等

视觉生成-AlibabaWood

视频生成-框架流程
视频生成-框架流程
视觉生成-视频封面

可以对视频内容全自动完成质量审核、内容分析与图像增强,输出多帧静止或动图。
图像增强:在内容理解的基础上裁剪或组合。
内容分析:基于深度学习的语义分析,根据吸引力挑选内容。
质量审核:根据模糊、爆光等因素过滤低质图像。

4、视觉编辑-移花接木

视觉编辑-视频植入
挖掘视频核心价值:扩展广告爆光渠道,创新广告形式,提升用户体验。 电视剧植入

扩大植入覆盖范围 :自动化批量处理视频内容,挖掘海量短视频、UGC内容等的广告价值,扩大植入内容的覆盖面。电影植入

提升植入效果效率:取代手工后期,缩短植入周期,降低人力成本,给广告招商留出充足时间,且不需要修改与流出媒资。综艺植入

考虑各个环节细节
在这里插入图片描述

视觉编辑-动态检测分割
自动检测到要处理的部分

视觉编辑-视频内容擦除
相关实用技术 :字幕擦除、台标擦除、广告擦除、场景文字擦除、人体擦除
核心挑战与亮点 粗定位、精分割、像素填充、在线训练

视觉编辑-文字擦除
去掉后期字幕 去掉原生文字
提升视频效果
视觉编辑-Logo擦除
视频某边角的平台Logo 擦除,
去掉广告 (区域大,标识无限)
去掉台标(标识有限)

视觉编辑-画幅变化
主体检测分割+背景拉伸+背景补全+智能构图裁剪+超分辨率=多保留50%有效画面;

视觉编辑-图像尺寸变化

在这里插入图片描述

5、视觉增强-修旧如新

视觉增强-视频增强
在这里插入图片描述

视觉增强-人脸修复增强
人脸是最重要的目标对象,对人像进行细节修复增强,有很重要的意义和价值。如提升清晰度

视觉增强-视频超分
整体提高视频分辨率

视觉增强-视频插帧

视觉增强-HDR色彩扩展
提升色彩 透亮

视觉增强-风格迁移
在这里插入图片描述
视觉迁移-颜色拓展
在这里插入图片描述

6、视觉制造-由虚入实

实体设计制造
在这里插入图片描述

视觉制造-核心编辑
在这里插入图片描述
视觉制造-包装几何生成
在这里插入图片描述

在这里插入图片描述

视觉制造-材质工艺
在这里插入图片描述

视觉制造-视觉迁移及融合
在这里插入图片描述
视觉制造-多样化拓展
在这里插入图片描述
视觉制造-2D3D融合
在这里插入图片描述

7、视频智能开放平台-万剑归宗

官网:vision.aliyun.com
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

通过以上的内容对视觉已经有了初步的认知
每天进步一点点!

相关文章
|
4天前
|
人工智能 自然语言处理 算法
企业内训|AI赋能业务和研发实战训练营-某卫星通信公司
TsingtaoAI为北京某卫星通信公司交付AI赋能业务和研发实战训练营,课程一共3天,覆盖全体员工和研发人员。本课程基于该公司“天地海一体化”业务场景,融合最新AI工具链与大模型技术(如DeepSeek、Coze、通义法睿等),以“场景驱动、工具落地、技术深化”为核心逻辑,覆盖全员通用能力与研发专项能力,通过案例实战实现业务与技术的双提升。
28 0
|
14天前
|
存储 人工智能 安全
有奖体验 AI 模特换装,解锁电商视觉新体验
有奖体验 AI 模特换装,解锁电商视觉新体验
|
16天前
|
存储 人工智能 安全
有奖体验 AI 模特换装,解锁电商视觉新体验
在电商中,制作精美的商品展示图成本高且流程复杂。AI 换装技术允许商家快速更换模特的服装或配件,无需重新拍摄,大大缩短准备时间。这项技术减少了对专业摄影师和后期团队的依赖,使中小商家也能轻松产出高质量的商品图片,灵活响应市场变化,有效降低成本,提升竞争力。本方案利用函数计算 FC 构建 Web 服务,采用百炼视觉模型 qwen-vl-max-latest、aitryon、aitryon-refiner、shoemodel-v1 来分别实现 AI 人物主体信息提取、模特试衣、试衣精修、模特换鞋。
|
2月前
|
数据采集 人工智能 算法
Seer:上海 AI Lab 与北大联合开源端到端操作模型,结合视觉预测与动作执行信息,使机器人任务提升成功率43%
Seer是由上海AI实验室与北大等机构联合推出的端到端操作模型,结合视觉预测与动作执行,显著提升机器人任务成功率。
94 20
Seer:上海 AI Lab 与北大联合开源端到端操作模型,结合视觉预测与动作执行信息,使机器人任务提升成功率43%
|
2月前
|
人工智能 UED
VersaGen:生成式 AI 代理,基于 Stable Diffusion 生成图像,专注于控制一至多个视觉主体等生成细节
VersaGen 是一款生成式 AI 代理,专注于文本到图像合成中的视觉控制能力,支持多种视觉控制类型,并通过优化策略提升图像生成质量和用户体验。
56 8
VersaGen:生成式 AI 代理,基于 Stable Diffusion 生成图像,专注于控制一至多个视觉主体等生成细节
|
3月前
|
人工智能 API 数据库
Browser Use:开源 AI 浏览器助手,自动完成网页交互任务,支持多标签页管理、视觉识别和内容提取等功能
Browser Use 是一款专为大语言模型设计的智能浏览器工具,支持多标签页管理、视觉识别、内容提取等功能,并能记录和重复执行特定动作,适用于多种应用场景。
1181 0
Browser Use:开源 AI 浏览器助手,自动完成网页交互任务,支持多标签页管理、视觉识别和内容提取等功能
|
3月前
|
机器学习/深度学习 人工智能 安全
合合信息亮相CSIG AI可信论坛,全面拆解视觉内容安全的“终极防线”!
合合信息在CSIG AI可信论坛上,全面拆解了视觉内容安全的“终极防线”。面对AI伪造泛滥的问题,如Deepfake换脸、PS篡改等,合合信息展示了其前沿技术,包括通用PS检测系统和AIGC与换脸检测系统,有效应对视觉内容安全挑战。公司在国际赛事中屡获殊荣,并联合多方发布《文本图像篡改检测系统技术要求》,推动行业标准化发展。通过技术创新,合合信息为金融、政企等领域提供可靠保障,守护社会信任,引领视觉内容安全新方向。
78 0
|
3月前
|
机器学习/深度学习 人工智能 物联网
AI赋能大学计划·大模型技术与应用实战学生训练营——湖南大学站圆满结营
12月14日,由中国软件行业校园招聘与实习公共服务平台携手魔搭社区共同举办的AI赋能大学计划·大模型技术与产业趋势高校行AIGC项目实战营·湖南大学站圆满结营。
218 58
AI赋能大学计划·大模型技术与应用实战学生训练营——湖南大学站圆满结营
|
3天前
|
人工智能 Kubernetes 安全
积极拥抱AI,F5携手NVIDIA赋能加速AI应用交付
积极拥抱AI,F5携手NVIDIA赋能加速AI应用交付
20 4
|
4天前
|
人工智能 前端开发 JavaScript
AI程序员:通义灵码 2.0应用VScode前端开发深度体验
AI程序员:通义灵码 2.0应用VScode前端开发深度体验,在软件开发领域,人工智能技术的融入正深刻改变着程序员的工作方式。通义灵码 2.0 作为一款先进的 AI 编程助手,与广受欢迎的代码编辑器 Visual Studio Code(VScode)相结合,为前端开发带来了全新的可能性。本文将详细分享通义灵码 2.0 在 VScode 前端开发环境中的深度使用体验。
79 2

热门文章

最新文章