达摩院视觉 AI 技术应用探索(三)|学习笔记

简介: 快速学习达摩院视觉 AI 技术应用探索(三)

开发者学堂课程【视觉 AI 应用开发教程 达摩院视觉 AI 技术应用探索(三)】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/289/detail/3410


达摩院视觉 AI 技术应用探索(三)


六、视觉迁移

1.视觉迁移—风格纹理变换

现有算法效果的缺点:

·要么风格化不足

•要么重要细节缺失和畸变

■如何充分风格化的同时保持重要细节不被损失或畸变?

·采用大感受野范围的特征进行匹配交换,导致原图细节缺失·采用小感受野范围的特征进行匹配交换,导致风格程度不足■实现方案:自适应多笔触布局(AttentionConsistency)

■图像区域重要度分析:Self Attention(自注意力 Ck 机制)

Self Attention GAN——感知远距离区域的特征相关性特征层计算,1x1卷积,降低计算开销

■多笔触融合

·强注意力区域采用精细粒度笔触,保证细节

弱注意力区域采用粗粒度笔触,充分风格化

image.png

2、视觉迁移——颜色拓展

image.png

视觉迁移一颜色拓展

■传统方案问题——效果差,效率低

·颜色不协调、单一

·受限:不支持位图,主视觉不突出,固定色卡,强交互

现有方案优势:

支持任意图作为参考色进行拓展:提取配色关系,学习参考配色与目标色间的对照关系,转换为二分图匹配问题,利用 Hungarian 算法求解最小分配代价

·计算两个颜色在色彩空间的距离,构建开销矩阵

·求解使得总颜色距离最小的映射,作为色卡的对应关系

√位图拓色效果优秀:通过约束空间一致性,对变换权重进行优化,解决颜色越阶跳变现象

√基于语义信息拓色尽可能保留了原稿主视觉信息:训练分类卷积神经网络(Inception),避免强语义元素不合理拓色(Precision:95%,Recall:83%,毫秒级响应)

绘定目标色系——绘定参考图——自动模式

算法指标:

高时效性:7层的1920*500图像,7种拓色,仅需1.8秒

高合理性:支持全自动配色/元素分拣过滤,效果更稳更好

高拓展性:支持单图、结构化图输入,可参照图片、色卡、智能配色进行拓展输出

 

七、视觉制造

1.实体设计制造

·效率低:多次打样,多次沟通(服装设计平均30天)

.协同差:设计、营销、生成脱节、倒置

.定制难:无法实现柔性生产

image.png

2、视觉制造的核心逻辑

image.png

数字商品:{试点计算 一致性计算 视觉迁移(纹理、材质等) 模型匹配 材质匹配 模型生成}→{实时渲染 离线渲染}

可以渲染到一个具体的图像和模式,去用于商业途径。

1. 视觉制造——包装设计

智能设计的优势:

几何生成          

材质工艺

智能设计

阵列布局  

2D3D 融合

视觉效果逼真、一键出图

·模型通用、尺寸自适应

.多种展示方式,实时修改和定制

匹配包装刀版图,直接对接供应链

几何生成:自适应纹理的几何生成:覆盖目前大部分常见包装类型。

image.png

自动布局:显著性检测,商品自旋转,布局变换矩阵计算,摄像机试点计算

2D3D 融合:集合一致性计算,3D 朝向设计,HDR 光照估计和融合渲染

image.png

4.视觉制造——三维几何自动生成

image.png

5.视觉制造——多样性拓展

image.png

6. 视觉制造——视觉迁移及融合

三维服饰检索:根据图像以及结构化找到匹配的三维模型

image.png

 

八、视觉公共云平台

1.视觉 API 开放平台一定位

解决方案 上层产品 能力组件 原子能力

本平台较关注能力组件和原子能力

image.png

例一:视觉智能开放平台——官网:vision.aliyun.com,里面有大概100中 API 能力

image.png

例二:视觉智能平台——能力布局

image.png

2.视觉智能开放平台的特点:

聚集达摩院及阿里巴巴经济体图像、视频、3D 视觉等领域的科学家和工程师沉淀的视觉 API 能力,打造全球领先的视觉智能技术商业化服务平台,让天下没有难用的视觉智能技术。

拥有阿里巴巴经济体海量场景和最佳案例中锤炼出来的视觉技术,为用户提供具备实战价值且有核心竞争力的视觉AI能力。

提供阿里巴巴经济体全方位视觉能力的输出,荟聚规模化、多样化、细粒度、场景化的视觉 AI 能力,为开发者和用户提供一站式能力选择。

依托阿里云智能坚实的基础设施服务,提供普惠易用的 AI 能力,采用通用且标准化的接口方式,让用户可以快速接入并使用视觉 API,省心省力。

image.png

相关文章
|
4天前
|
人工智能 自然语言处理 Serverless
阿里云函数计算 x NVIDIA 加速企业 AI 应用落地
阿里云函数计算与 NVIDIA TensorRT/TensorRT-LLM 展开合作,通过结合阿里云的无缝计算体验和 NVIDIA 的高性能推理库,开发者能够以更低的成本、更高的效率完成复杂的 AI 任务,加速技术落地和应用创新。
|
3天前
|
数据采集 机器学习/深度学习 人工智能
AI在医疗诊断中的应用
【9月更文挑战第15天】本文将探讨人工智能(AI)在医疗诊断领域的应用。我们将首先介绍AI的基本概念和其在医疗领域的潜力,然后通过一些具体的案例来展示AI如何帮助医生进行更准确的诊断。最后,我们将讨论AI在医疗诊断中面临的挑战和未来的可能性。
|
3天前
|
机器学习/深度学习 人工智能 搜索推荐
AI在医疗诊断中的应用:精准医疗的加速发展
【9月更文挑战第16天】随着人工智能(AI)技术的不断进步,医疗领域正经历前所未有的变革。本文探讨了AI在医学影像分析、病历数据分析和病症诊断预测等方面的应用,展示了其在提高诊断准确性、推动个性化治疗和促进医疗资源均衡分布方面的巨大潜力。AI正加速精准医疗的发展,有望在未来实现更智能、个性化的医疗服务,全面提升医疗质量和效率。
31 11
|
5天前
|
机器学习/深度学习 人工智能 算法
AI在医疗诊断中的应用与挑战
人工智能技术在医疗领域的应用日益广泛,尤其在医疗诊断中显示出巨大的潜力和优势。本文将探讨AI在医疗诊断中的应用,包括影像识别、病理分析、个性化治疗方案等,同时分析当前面临的挑战,如数据隐私、算法偏见和法规制约。通过对具体案例和技术原理的分析,我们希望能为读者提供一个全面而深入的视角,理解AI如何在医疗诊断中发挥作用,以及未来可能的发展方向。
|
机器学习/深度学习 新零售 人工智能
阿里云高校计划视觉AI五天训练营 Day 1——视觉应用探索
在这个人工智能已经普及的时代,各行各业都充斥着AI的身影。大部分人认为人工智能起点高,入门难,想要使用AI服务又无法独立完成编写,开发者可以通过阿里云视觉平台提供的通用且标准化的接入方式,快速接入及使用阿里云视觉平台提供的包括人脸人体、文字识别、商品理解、内容安全、图像识别、图像生产、分割抠图、视觉搜索、目标检测、图像分析处理、视频理解、视频生产、视频分割13个类目多个API能力,为其提供高易用、普惠的视觉API服务,帮助企业快速建立视觉智能技术的应用能力的综合性视觉AI能力平台。
1285 0
阿里云高校计划视觉AI五天训练营 Day 1——视觉应用探索
|
JSON 人工智能 API
阿里云高校计划视觉AI五天训练营 Day5
关爱环境卫生,人人有责,怎么快速识别垃圾的种类扔进相应的垃圾桶中,那接下来看如何快速识别垃圾分类。
阿里云高校计划视觉AI五天训练营 Day5
|
人工智能 前端开发 算法
视觉AI五天训练营教程 Day 3
简介: 在这个人工智能已经普及的时代,各行各业都充斥着AI的身影。大部分人认为人工智能起点高,入门难,想要使用AI服务又无法独立完成编写,阿里云视觉平台是基于阿里巴巴视觉智能技术实践经验,面向视觉智能技术企业和开发商(含开发者),为其提供高易用、普惠的视觉API服务,帮助企业快速建立视觉智能技术的应用能力的综合性视觉AI能力平台。开发者可以通过阿里云视觉平台提供的通用且标准化的接入方式,快速接入及使用阿里云视觉平台提供的包括人脸人体、文字识别、商品理解、内容安全、图像识别、图像生产、分割抠图、视觉搜索、目标检测、图像分析处理、视频理解、视频生产、视频分割13个类目多个API能力。本期直播将带你
561 0
视觉AI五天训练营教程 Day 3
|
编解码 人工智能 文字识别
阿里云高校计划视觉AI五天训练营 Day 2——身份证识别系统
本文介绍了如何使用阿里云视觉智能开放平台相关服务的PHP SDK,具体包括SDK的获取和安装方法以及SDK代码示例。
455 0
阿里云高校计划视觉AI五天训练营 Day 2——身份证识别系统
|
人工智能
阿里云高校计划视觉AI五天训练营教程 Day 2 - 身份证识别系统搭建
实战讲述如何使用阿里云视觉平台API快速开发在线视觉AI平台,主要如何为如何搭建身份证识别系统,进而扩展到其他的识别系统。
阿里云高校计划视觉AI五天训练营教程 Day 2 - 身份证识别系统搭建
|
人工智能 文字识别 前端开发
阿里云高校计划视觉AI五天训练营教程 Day 2 - 身份证识别系统搭建
本篇文章是基于阿里云高校计划AI课程第二讲,身份证识别系统搭建。在阿里云视觉开放平台上已有调试功能。
293 0
阿里云高校计划视觉AI五天训练营教程 Day 2 - 身份证识别系统搭建

热门文章

最新文章