视觉AI技术应用探索学习笔记

简介: 第一天-应用探索学习笔记

定义

通过一个/一系列视觉过程,产生新的视觉表达

image-20200924091138037

分类

  • 生成:从0到1
  • 扩展:从1到N
  • 摘要:从N到1(把主要的信息浓缩起来)
  • 升维:从An到An+1
  • 增强/变换:从A到B
  • 插入/合成: A+B = C
  • 擦除: A-B=C

基础通用框架

image-20200924091900976

五个关键维度

视觉生产要满足5个规范要求才是一个好的视觉

  1. 满足视觉,美学表现符合人们的审美
  2. 合乎语义,内容逻辑
  3. 保证结果的丰富性
  4. 提供用户预期的抓手,让用户可以添加一些控制因素
  5. 要具有商业价值

精细理解-分割抠图

  1. 识别:知道是什么
  2. 检测:识别+知道在哪儿(缺陷检测,多目标检测)
  3. 分割:识别+检测+知道每个像素是什么(全景分割,病灶分割)(视觉分割时生产的必要前置步骤)

分割抠图难点

  • 复杂背景
  • 遮挡
  • 发丝精抠
  • 边缘反色
  • 多尺度/目标
  • 数据不足

分割思路

思路

  1. 复杂问题拆解:mask估计+精准matting
  2. 丰富数据样本:设计图像mask同一模型

类型

  • 语义分割(Semantic Segmentation):分析出事什么东西,比如是个人
  • 实例分割(Instance Segmentation):分析出这个人是谁
  • 图像抠图技术(Image Matting):处理图像

image-20200924103243394

模型框架

image-20200924093747005

从无到有

鹿班

功能:平面图像设计生成

框架流程

image-20200924101113146

AlibaabWood

功能:短视频设计生成

框架流程

image-20200924101352822

视频编辑-移花接木

应用方面

  • 视频植入
  • 动态监测分割
  • 视频内容擦除

    • 文字擦除
    • Logo擦除
  • 画幅变化
  • 图像尺寸变化

视觉增强-修旧如新

核心逻辑

image-20200924102101381

应用方面

  • 人脸修复增强
  • 渲染图超分
  • 视频超分
  • 视频插帧
  • HDR色彩扩展
  • 风格迁移
  • 颜色扩展

视觉制造-由虚入实

核心逻辑

image-20200924102502018

应用方面

  • 包装几何生成
  • 服装几何生成
  • 视觉迁移及融合
  • 多样性拓展
  • 2D3D融合

视觉智能开放平台

集合上面的一些视觉功能以及其他的功能,网址vision.aliyun.com

相关文章
|
5天前
|
机器学习/深度学习 人工智能 自动驾驶
企业内训|AI大模型在汽车行业的前沿应用研修-某汽车集团
本课程是TsingtaoAI为某汽车集团高级项目经理设计研发,课程全面系统地解析AI的发展历程、技术基础及其在汽车行业的深度应用。通过深入浅出的理论讲解、丰富的行业案例分析以及实战项目训练,学员将全面掌握机器学习、深度学习、NLP与CV等核心技术,了解自动驾驶、智能制造、车联网与智能营销等关键应用场景,洞悉AI技术对企业战略布局的深远影响。
131 97
|
2天前
|
机器学习/深度学习 人工智能 自然语言处理
CogAgent-9B:智谱 AI 开源 GLM-PC 的基座模型,专注于预测和执行 GUI 操作,可应用于自动化交互任务
CogAgent-9B 是智谱AI基于 GLM-4V-9B 训练的专用Agent任务模型,支持高分辨率图像处理和双语交互,能够预测并执行GUI操作,广泛应用于自动化任务。
31 12
CogAgent-9B:智谱 AI 开源 GLM-PC 的基座模型,专注于预测和执行 GUI 操作,可应用于自动化交互任务
|
2天前
|
数据采集 人工智能 运维
从企业级 RAG 到 AI Assistant,阿里云Elasticsearch AI 搜索技术实践
本文介绍了阿里云 Elasticsearch 推出的创新型 AI 搜索方案
从企业级 RAG 到 AI Assistant,阿里云Elasticsearch AI 搜索技术实践
|
20小时前
|
人工智能 UED
VersaGen:生成式 AI 代理,基于 Stable Diffusion 生成图像,专注于控制一至多个视觉主体等生成细节
VersaGen 是一款生成式 AI 代理,专注于文本到图像合成中的视觉控制能力,支持多种视觉控制类型,并通过优化策略提升图像生成质量和用户体验。
19 8
VersaGen:生成式 AI 代理,基于 Stable Diffusion 生成图像,专注于控制一至多个视觉主体等生成细节
|
4天前
|
机器学习/深度学习 数据采集 人工智能
AI在用户行为分析中的应用:实现精准洞察与决策优化
AI在用户行为分析中的应用:实现精准洞察与决策优化
42 15
|
3天前
|
人工智能 资源调度 调度
云上AI Infra解锁大模型创新应用
本节课程由阿里云智能集团资深技术专家王超分享,主题为AI基础设施的发展趋势。课程聚焦于AI Infra设计与Scaling Law,探讨了下一代AI基础设施的设计目标、功能升级及推理场景中的应用。主要内容包括高效支持大规模模型训练和推理、全球调度系统的设计、Rack level的Scale优化以及多租户容器化使用方式。通过这些改进,旨在提升并行效率、资源利用率及稳定性,推动AI基础设施迈向更高性能和更优调度的新阶段。
|
4天前
|
机器学习/深度学习 人工智能 自然语言处理
师资研修|AI技术赋能教材建设和课程开发——乌鲁木齐某教育部门
近日,TsingtaoAI派出AI专家为乌鲁木齐中职院校的教师团队,举办“AI技术赋能教材建设与课程开发”的师资研修。此次培训由TsingtaoAI的AI专家高寒和教育专家刘建老师亲自授课,面对的是来自乌鲁木齐的教育工作者,特别是中职院校的教学骨干。整个活动不仅涉及人工智能技术本身的深度解析,还深入探讨了如何将这些前沿技术高效应用于教材和课程体系的创新。
27 0
|
机器学习/深度学习 新零售 人工智能
阿里云高校计划视觉AI五天训练营 Day 1——视觉应用探索
在这个人工智能已经普及的时代,各行各业都充斥着AI的身影。大部分人认为人工智能起点高,入门难,想要使用AI服务又无法独立完成编写,开发者可以通过阿里云视觉平台提供的通用且标准化的接入方式,快速接入及使用阿里云视觉平台提供的包括人脸人体、文字识别、商品理解、内容安全、图像识别、图像生产、分割抠图、视觉搜索、目标检测、图像分析处理、视频理解、视频生产、视频分割13个类目多个API能力,为其提供高易用、普惠的视觉API服务,帮助企业快速建立视觉智能技术的应用能力的综合性视觉AI能力平台。
1304 0
阿里云高校计划视觉AI五天训练营 Day 1——视觉应用探索
|
人工智能 前端开发 算法
视觉AI五天训练营教程 Day 3
简介: 在这个人工智能已经普及的时代,各行各业都充斥着AI的身影。大部分人认为人工智能起点高,入门难,想要使用AI服务又无法独立完成编写,阿里云视觉平台是基于阿里巴巴视觉智能技术实践经验,面向视觉智能技术企业和开发商(含开发者),为其提供高易用、普惠的视觉API服务,帮助企业快速建立视觉智能技术的应用能力的综合性视觉AI能力平台。开发者可以通过阿里云视觉平台提供的通用且标准化的接入方式,快速接入及使用阿里云视觉平台提供的包括人脸人体、文字识别、商品理解、内容安全、图像识别、图像生产、分割抠图、视觉搜索、目标检测、图像分析处理、视频理解、视频生产、视频分割13个类目多个API能力。本期直播将带你
578 0
视觉AI五天训练营教程 Day 3
|
编解码 人工智能 文字识别
阿里云高校计划视觉AI五天训练营 Day 2——身份证识别系统
本文介绍了如何使用阿里云视觉智能开放平台相关服务的PHP SDK,具体包括SDK的获取和安装方法以及SDK代码示例。
468 0
阿里云高校计划视觉AI五天训练营 Day 2——身份证识别系统