视觉AI技术应用探索

2020-09-24 441

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 视觉AI技术应用探索

What is视觉生产

通过一个/一系列视觉过程，产出新的视觉表达。
产出:人或机器能够感知的图像视频，而不是标签或特征;

2.视觉生产的分类

生成:从0到1
拓展:从1到N
摘要:从N到1
升维:从An到An+1

视觉生产的通用框架

3.视觉生产的五个关键维度

满足视觉/美学表现;合乎语义/内容逻辑;保证结果的丰富性;提供用户预期的抓手;带来用户/商业价值

1.识别

含义：知道是什么

2.检测

含义：识别+知道在哪儿

3.分割

含义：识别+检测+知道每一个像素是什么
含义：数据严重不足，标注成本高
思路：复杂问题拆解:粗mask估计+精准matting，丰富数据样本:设计图像mask统一模型

视觉生成

鹿班是视觉生成领域在业界落地的先行者，对外提供大规模在线的Al设计服务

视觉生成的流程

理需求，定草图，选状态，调细节，生成图，评好坏

视频编辑

视频植入

挖掘视频，核心价值部分；扩大植入，珈盖范围；提升植入，效果效率

视频编辑

删除不要的内容

视觉增强

视觉增强——风格迁徙

经过SOTA显著性检测算法(SalGAN)验证，该算法有效提升了风格迁移的Attention Consistency。

视觉迁徙——颜色扩展

即通过算法改变颜色

视觉制造——由虚入实

实体设计制造现状

效率低:多次打样，多次沟通（服装设计平均30天)
·定制难:无法实现柔性生产
·协同差:设计、营销、生成脱节、倒置
AI后流程
输入，生成，多样，生产

总结

深度学习的实质，是通过构建具有很多隐层的机器学习模型和海量的训练数据，来学习更有用的特征，从而最终提升分类或预测的准确性。因此，“深度模型”是手段，“特征学习”是目的。区别于传统的浅层学习，深度学习的不同在于：1）强调了模型结构的深度，通常有5层、6层，甚至10多层的隐层节点；2）明确突出了特征学习的重要性，也就是说，通过逐层特征变换，将样本在原空间的特征表示变换到一个新特征空间，从而使分类或预测更加容易。与人工规则构造特征的方法相比，利用大数据来学习特征，更能够刻画数据的丰富内在信息。

视觉AI技术应用探索

What is视觉生产

2.视觉生产的分类

视觉生产的通用框架

3.视觉生产的五个关键维度

1.识别

2.检测

3.分割

视觉生成

视觉生成

视觉生成的流程

视频编辑

视频植入

视频编辑

视觉增强

视觉增强——风格迁徙

视觉迁徙——颜色扩展

视觉制造——由虚入实

实体设计制造现状

总结

热门文章

最新文章

相关课程

相关电子书

相关实验场景

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

视觉AI技术应用探索

What is视觉生产

2.视觉生产的分类

视觉生产的通用框架

3.视觉生产的五个关键维度

1.识别

2.检测

3.分割

视觉生成

视觉生成

视觉生成的流程

视频编辑

视频植入

视频编辑

视觉增强

视觉增强——风格迁徙

视觉迁徙——颜色扩展

视觉制造——由虚入实

实体设计制造现状

总结

热门文章

最新文章

相关课程

相关电子书

相关实验场景