视觉AI技术应用探索学习笔记

简介: 第一天-应用探索学习笔记
+关注继续查看

定义

通过一个/一系列视觉过程,产生新的视觉表达

image-20200924091138037

分类

  • 生成:从0到1
  • 扩展:从1到N
  • 摘要:从N到1(把主要的信息浓缩起来)
  • 升维:从An到An+1
  • 增强/变换:从A到B
  • 插入/合成: A+B = C
  • 擦除: A-B=C

基础通用框架

image-20200924091900976

五个关键维度

视觉生产要满足5个规范要求才是一个好的视觉

  1. 满足视觉,美学表现符合人们的审美
  2. 合乎语义,内容逻辑
  3. 保证结果的丰富性
  4. 提供用户预期的抓手,让用户可以添加一些控制因素
  5. 要具有商业价值

精细理解-分割抠图

  1. 识别:知道是什么
  2. 检测:识别+知道在哪儿(缺陷检测,多目标检测)
  3. 分割:识别+检测+知道每个像素是什么(全景分割,病灶分割)(视觉分割时生产的必要前置步骤)

分割抠图难点

  • 复杂背景
  • 遮挡
  • 发丝精抠
  • 边缘反色
  • 多尺度/目标
  • 数据不足

分割思路

思路

  1. 复杂问题拆解:mask估计+精准matting
  2. 丰富数据样本:设计图像mask同一模型

类型

  • 语义分割(Semantic Segmentation):分析出事什么东西,比如是个人
  • 实例分割(Instance Segmentation):分析出这个人是谁
  • 图像抠图技术(Image Matting):处理图像

image-20200924103243394

模型框架

image-20200924093747005

从无到有

鹿班

功能:平面图像设计生成

框架流程

image-20200924101113146

AlibaabWood

功能:短视频设计生成

框架流程

image-20200924101352822

视频编辑-移花接木

应用方面

  • 视频植入
  • 动态监测分割
  • 视频内容擦除

    • 文字擦除
    • Logo擦除
  • 画幅变化
  • 图像尺寸变化

视觉增强-修旧如新

核心逻辑

image-20200924102101381

应用方面

  • 人脸修复增强
  • 渲染图超分
  • 视频超分
  • 视频插帧
  • HDR色彩扩展
  • 风格迁移
  • 颜色扩展

视觉制造-由虚入实

核心逻辑

image-20200924102502018

应用方面

  • 包装几何生成
  • 服装几何生成
  • 视觉迁移及融合
  • 多样性拓展
  • 2D3D融合

视觉智能开放平台

集合上面的一些视觉功能以及其他的功能,网址vision.aliyun.com

相关文章
|
12天前
|
人工智能 搜索推荐
ai技术能在生活起到什么作用
人工智能 (AI) 技术正在迅速改变我们的生活。 它已经被用于开发各种各样的应用程序,从帮助我们找到停车位到诊断疾病。
38 0
|
12天前
|
机器学习/深度学习 人工智能 自然语言处理
AI技术的发展
人工智能(Artificial Intelligence,简称AI),指的是模拟人类智能的一种技术。它是计算机科学的一个分支,其目标是通过机器来模拟、延伸和扩展人类的智能,并最终创造出一种新的智能体。
17 0
|
16天前
|
存储 人工智能 Cloud Native
云原生架构如何助力大数据和AI技术在软件开发中的深度整合
b. 更低的成本 云原生环境提供了成本效益高、按需付费的模型,开发者只需支付他们实际使用的资源。这降低了大数据处理和AI模型训练的成本,使创新更加经济。
|
16天前
|
人工智能 Kubernetes 大数据
探索云原生容器编排技术:如Kubernetes如何为大数据处理和AI模型的自动化部署带来便利
Kubernetes以容器为基础,将应用程序和其依赖项封装在容器中。这使得大数据处理和AI模型的部署更加一致和可移植,可以在不同的环境中轻松部署,包括开发、测试和生产环境。
|
16天前
|
人工智能 Cloud Native 安全
大数据、AI和云原生:引领未来软件开发的技术演进
大数据、AI和云原生:引领未来软件开发的技术演进
|
16天前
|
人工智能 API 云计算
飞天技术观|ModelScope:共建模型生态,以模型自由加速AI应用创新
基于「模型即服务」,即MaaS(ModelasaService)的理念,ModelScope通过不断降低模型应用门槛,让AI更普惠,帮助开发者在ModelScope上能够低成本、高效地使用模型,并建立起良好的模型生态和开发者生态。
119 0
|
1月前
|
人工智能 算法框架/工具 Anolis
Anolis OS 23 基于 AMD 实例的 AI 推理优化实践 | 龙蜥技术
如何使用龙蜥社区容器镜像加速 AI 应用推理部署?
|
2月前
|
机器学习/深度学习 人工智能 Android开发
2023 Google 开发者大会 – AI 领域的技术更新
Google 开发者大会是 Google 面向开发者和科技爱好者展示最新产品和平台的年度盛会。2023 Google 开发者大会 (Google I/O Connect | China) 为开发者提供丰富的学习资源,实践操作和现场演示,提供与谷歌专家互动、与其他开发者交流的契机,助力开发提效,释放团队创造力,简化工作流程,以开放式集成解决方案为开发者效力,共同构建创新生态,开启美好未来。
331 2
|
2月前
|
机器学习/深度学习 人工智能 算法
AI图生成技术:从随机噪声到逼真图像
在人工智能的快速发展中,图像生成是一个备受关注的研究领域。AI图生成技术通过训练深度神经网络来生成逼真的图像,为我们提供了许多有趣的应用场景,如风格转换、图像修复和虚拟现实等。本篇博客将介绍一种基于随机噪声的AI图生成技术,并探讨其背后的原理和应用。
43 1
相关产品
机器翻译
推荐文章
更多