视觉AI技术应用探索 -阿里云开发者社区

开发者社区> 人工智能> 正文

视觉AI技术应用探索

简介: 视觉AI技术应用探索

What is视觉生产

通过一个/一系列视觉过程,产出新的视觉表达。
产出:人或机器能够感知的图像视频,而不是标签或特征;

image.png

2.视觉生产的分类

  • 生成:从0到1
  • 拓展:从1到N
  • 摘要:从N到1
  • 升维:从An到An+1

视觉生产的通用框架

image.png

3.视觉生产的五个关键维度

满足视觉/美学表现;合乎语义/内容逻辑;保证结果的丰富性;提供用户预期的抓手;带来用户/商业价值

1.识别

含义:知道是什么

2.检测

含义:识别+知道在哪儿

3.分割

含义:识别+检测+知道每一个像素是什么
含义 :数据严重不足,标注成本高
思路:复杂问题拆解:粗mask估计+精准matting,丰富数据样本:设计图像mask统一模型

视觉生成

视觉生成

鹿班是视觉生成领域在业界落地的先行者,对外提供大规模在线的Al设计服务

视觉生成的流程

理需求,定草图,选状态,调细节,生成图,评好坏

视频编辑

视频植入

挖掘视频,核心价值部分;扩大植入,珈盖范围;提升植入,效果效率

视频编辑

删除不要的内容

视觉增强

视觉增强——风格迁徙

经过SOTA显著性检测算法(SalGAN)验证,该算法有效提升了风格迁移的Attention Consistency。

视觉迁徙——颜色扩展

即通过算法改变颜色

视觉制造——由虚入实

实体设计制造现状

效率低:多次打样,多次沟通(服装设计平均30天)
·定制难:无法实现柔性生产
·协同差:设计、营销、生成脱节、倒置
AI后流程
输入,生成,多样,生产

总结

深度学习的实质,是通过构建具有很多隐层的机器学习模型和海量的训练数据,来学习更有用的特征,从而最终提升分类或预测的准确性。因此,“深度模型”是手段,“特征学习”是目的。区别于传统的浅层学习,深度学习的不同在于:1)强调了模型结构的深度,通常有5层、6层,甚至10多层的隐层节点;2)明确突出了特征学习的重要性,也就是说,通过逐层特征变换,将样本在原空间的特征表示变换到一个新特征空间,从而使分类或预测更加容易。与人工规则构造特征的方法相比,利用大数据来学习特征,更能够刻画数据的丰富内在信息。

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

分享:
人工智能
使用钉钉扫一扫加入圈子
+ 订阅

了解行业+人工智能最先进的技术和实践,参与行业+人工智能实践项目

其他文章