阿里云视觉ai训练第一天

简介: 阿里云视觉ai训练第一天笔记总结

视觉生产技术

定义和分类

定义:视觉分为视觉理解(检测分割)、视觉生产(产生视觉)。视觉生产是通过一个或者一系列视觉过程,产生新的视觉表达。

产出:人或机器能感知图像视频而不是标签或特征

要求:新的,和输入的不一样
image.png

分类:生成:从0到1、拓展:从1到N、摘要:从N到1、升维:从An到An+1、增强:从A到B、插入:A+B=C、擦除A-B=C
image.png

五个关键维度:

1.满足视觉表现

2.合乎语义逻辑

3.保证结果丰富

4.提供用户预期抓手

5.带来用户商业价值

精细理解

识别、检测、分割:理解整体、位置和每一个像素

分割抠图难点:复杂背景、遮挡、发丝、反色、透明材质、多材质

思路:问题拆解:mask估计+精准matting,丰富数据样本

image.png

视觉生成

照图生图:参考原图风格

个性化设计:多元化设计

平面生成、短视频生成:准备素材+基础、智能特效+编排

视频摘要:镜头分割、动作识别、镜头筛选、排序优化、视频合成

视频封面:图像增强+内容分析+质量审核+场景要求

视觉编辑

image.png

视频植入:扩展广告曝光渠道,扩大范围、提升植入效果

动态监测分割

视频内容擦除:字幕、台标、广告、文字、人体擦除,去掉后期、原生字幕

image.png

画幅变化:保留有效画面、内容不全

视觉增强

人脸增强、去噪声、通用场景超分、LDR升HDR、倍频、去划痕

视频插帧

HDR色彩扩展

风格迁移

视觉制造

包装几何生成

材质工艺

视觉迁移和融合

多样性拓展

2D3D融合

视觉开放平台

目录
相关文章
|
5月前
|
人工智能 文字识别 监控
|
5月前
|
云安全 人工智能 安全
Dify平台集成阿里云AI安全护栏,构建AI Runtime安全防线
阿里云 AI 安全护栏加入Dify平台,打造可信赖的 AI
3311 166
|
5月前
|
人工智能 vr&ar UED
获奖公布|第十九届"挑战杯"竞赛2025年度中国青年科技创新"揭榜挂帅"擂台赛阿里云“AI技术助力乡村振兴”专题赛拟授奖名单公示
获奖公布|第十九届"挑战杯"竞赛2025年度中国青年科技创新"揭榜挂帅"擂台赛阿里云“AI技术助力乡村振兴”专题赛拟授奖名单公示
|
5月前
|
机器学习/深度学习 人工智能 Serverless
吉利汽车携手阿里云函数计算,打造新一代 AI 座舱推理引擎
当前吉利汽车研究院人工智能团队承担了吉利汽车座舱 AI 智能化的方案建设,在和阿里云的合作中,基于星睿智算中心 2.0 的 23.5EFLOPS 强大算力,构建 AI 混合云架构,面向百万级用户的实时推理计算引入阿里云函数计算的 Serverless GPU 算力集群,共同为智能座舱的交互和娱乐功能提供大模型推理业务服务,涵盖的场景如针对模糊指令的复杂意图解析、文生图、情感 TTS 等。
|
5月前
|
机器学习/深度学习 人工智能 JSON
PHP从0到1实现 AI 智能体系统并且训练知识库资料
本文详解如何用PHP从0到1构建AI智能体,涵盖提示词设计、记忆管理、知识库集成与反馈优化四大核心训练维度,结合实战案例与系统架构,助你打造懂业务、会进化的专属AI助手。
628 6
|
5月前
|
机器学习/深度学习 人工智能 算法
阿里云视频云以 360° 实时回放技术支撑 NBA 2025 中国赛 —— AI 开启“智能观赛”新体验
NBA中国与阿里云达成合作,首发360°实时回放技术,融合AI视觉引擎,实现多视角、低延时、沉浸式观赛新体验,重新定义体育赛事观看方式。
916 0
阿里云视频云以 360° 实时回放技术支撑 NBA 2025 中国赛 —— AI 开启“智能观赛”新体验
|
5月前
|
存储 人工智能 OLAP
AI Agent越用越笨?阿里云AnalyticDB「AI上下文工程」一招破解!
AI上下文工程是优化大模型交互的系统化框架,通过管理指令、记忆、知识库等上下文要素,解决信息缺失、长度溢出与上下文失效等问题。依托AnalyticDB等技术,实现上下文的采集、存储、组装与调度,提升AI Agent的准确性与协同效率,助力企业构建高效、稳定的智能应用。
|
机器学习/深度学习 新零售 人工智能
阿里云高校计划视觉AI五天训练营 Day 1——视觉应用探索
在这个人工智能已经普及的时代,各行各业都充斥着AI的身影。大部分人认为人工智能起点高,入门难,想要使用AI服务又无法独立完成编写,开发者可以通过阿里云视觉平台提供的通用且标准化的接入方式,快速接入及使用阿里云视觉平台提供的包括人脸人体、文字识别、商品理解、内容安全、图像识别、图像生产、分割抠图、视觉搜索、目标检测、图像分析处理、视频理解、视频生产、视频分割13个类目多个API能力,为其提供高易用、普惠的视觉API服务,帮助企业快速建立视觉智能技术的应用能力的综合性视觉AI能力平台。
1484 0
阿里云高校计划视觉AI五天训练营 Day 1——视觉应用探索
|
人工智能 前端开发 算法
视觉AI五天训练营教程 Day 3
简介: 在这个人工智能已经普及的时代,各行各业都充斥着AI的身影。大部分人认为人工智能起点高,入门难,想要使用AI服务又无法独立完成编写,阿里云视觉平台是基于阿里巴巴视觉智能技术实践经验,面向视觉智能技术企业和开发商(含开发者),为其提供高易用、普惠的视觉API服务,帮助企业快速建立视觉智能技术的应用能力的综合性视觉AI能力平台。开发者可以通过阿里云视觉平台提供的通用且标准化的接入方式,快速接入及使用阿里云视觉平台提供的包括人脸人体、文字识别、商品理解、内容安全、图像识别、图像生产、分割抠图、视觉搜索、目标检测、图像分析处理、视频理解、视频生产、视频分割13个类目多个API能力。本期直播将带你
718 0
视觉AI五天训练营教程 Day 3