视觉生产技术的探索应用

简介: 阿里云视觉平台是基于阿里巴巴视觉智能技术实践经验,面向视觉智能技术企业和开发商(含开发者),为其提供高易用、普惠的视觉API服务,帮助企业快速建立视觉智能技术的应用能力的综合性视觉AI能力平台。

视觉生产

定义

通过一个或一系列视觉过程,产生新的视觉表达。
1.png

分类

生成:从0到1
拓展:从1到N
摘要:从N到1
升维:从An到An+1

通用框架

3.png

视觉生产五个关键维度

  1. 满足视觉美学表现,可看
  2. 合乎语义内容逻辑
  3. 保证结果丰富性
  4. 提供用户预期的抓手,可控
  5. 带来用户和商业价值
    4.png

具体细节的一些理解

视觉分割是生产的必要前置步骤,唯有理解方能生成。
识别:知道是什么
111.png

检测:识别+知道在哪里
5.png

分割:识别+检测
222.png

分割抠图的难点

复杂背景
遮挡
发丝精扣
边缘反色
透明材质
多尺度,多目标

数据严重不住,标注成本高

分割抠图的解绝
语义分割
实例分割
image matting
6.png

分割抠图 模型框架
step1 mask粗分割
step2 mask质量统一
step3 估计精确alpha

分割抠图 抠图扩展
人像-分割不同区域
7.png

物体抠图
8.png

场景
9.png

视觉生成

平面图像设计生成——鹿班

框架流程:
需求-草图-选状态-调细节-生成-评价
样例:电商需求设计,照图生图,个性化设计,智能美工,

视频生成——AlibabaWood

框架流程:
素材准备-基础特效-智能特效-智能编排
样例:视频封面,商品展示

视觉编辑

视频的增删查改
视频植入:广告位检测定位,广告位跟踪,遮挡,透视,素材匹配,光影渲染
333.png

动态检测分割

视频内容擦除
擦除字幕,台标,广告,场景文字
流程:
定位-分割-充填-训练
11.png

画幅变化

视频画幅变化:主体检测分割+背景拉伸+背景补全+智能构图裁剪+超分辨率=多保留有效画面
图像尺寸变化

视觉增强

主要包括:人脸增强,去噪声,通用场景超分,LDR升HDR,视频插帧等
人脸增强
12.png

场景超分
13.png

颜色扩展
14.png

视觉制造

包装设计
服装设计:3d,材质工艺,纹理图案迁移,流行色,背景融合
15.png

目录
相关文章
|
云安全 存储 安全
一文看全数据跨境合规
于9月1日正式实施的《数据安全法》再次加码数据出境安全。 基于8月27日《数据安全法》解读与阿里云三大合规方案线上直播活动,阿里云解决方案架构师锅涛分享的《数据跨境流转安全》主题内容,整理出数据出境安全的九问九答,为企业数据跨境流转送上安全锦囊。
1683 0
一文看全数据跨境合规
|
机器学习/深度学习 网络架构
浅谈神经网络中的bias
1、什么是bias? 偏置单元(bias unit),在有些资料里也称为偏置项(bias term)或者截距项(intercept term),它其实就是函数的截距,与线性方程 y=wx+b 中的 b 的意义是一致的。在 y=wx+b中,b表示函数在y轴上的截距,控制着函数偏离原点的距离,其实在神经网络中的偏置单元也是类似的作用。 因此,神经网络的参数也可以表示为:(W, b),其中W表示参数矩阵,b表示偏置项或截距项。
2062 0
浅谈神经网络中的bias
|
算法 计算机视觉
YOLOv3 的非极大值抑制(NMS)算法是如何工作的,它对最终检测结果有何影响?
YOLOv3 的非极大值抑制(NMS)算法是如何工作的,它对最终检测结果有何影响?
|
IDE 测试技术 开发工具
10个必备Python调试技巧:从pdb到单元测试的开发效率提升指南
在Python开发中,调试是提升效率的关键技能。本文总结了10个实用的调试方法,涵盖内置调试器pdb、breakpoint()函数、断言机制、logging模块、列表推导式优化、IPython调试、警告机制、IDE调试工具、inspect模块和单元测试框架的应用。通过这些技巧,开发者可以更高效地定位和解决问题,提高代码质量。
1308 8
10个必备Python调试技巧:从pdb到单元测试的开发效率提升指南
|
前端开发 JavaScript Serverless
什么是比较好的低代码产品?
本文汇总了几种业界的低代码,如果找到了对应的场景,同时又可以真正解决问题,低代码比原本敲代码要快,会是一个很好的发展空间。
|
消息中间件 缓存 Java
java nio,netty,kafka 中经常提到“零拷贝”到底是什么?
零拷贝技术 Zero-Copy 是指计算机执行操作时,可以直接从源(如文件或网络套接字)将数据传输到目标缓冲区, 而不需要 CPU 先将数据从某处内存复制到另一个特定区域,从而减少上下文切换以及 CPU 的拷贝时间。
java nio,netty,kafka 中经常提到“零拷贝”到底是什么?
|
开发框架 JSON 安全
分享一个 .NET Core 使用选项方式读取配置内容的详细例子
分享一个 .NET Core 使用选项方式读取配置内容的详细例子
241 1
|
弹性计算 JSON 开发工具
"一键玩转阿里云ECS!Python大神揭秘:如何自动化创建镜像并跨地域复制,让你的云资源部署秒变高效达人!"
【8月更文挑战第14天】本文介绍如何使用Python与阿里云SDK自动化管理ECS镜像,包括创建镜像及跨地域复制,以优化云资源部署。首先安装`aliyun-python-sdk-ecs`并配置阿里云凭证。接着,通过Python脚本实现镜像创建与复制功能,简化日常运维工作并增强灾难恢复能力。注意权限及费用问题。
462 2
|
JavaScript 前端开发
qml 信号和处理程序事件系统(Signal and Handler Event System)
qml 信号和处理程序事件系统(Signal and Handler Event System)
394 0
|
机器学习/深度学习 存储 监控
基于YOLOv8深度学习的120种犬类检测与识别系统【python源码+Pyqt5界面+数据集+训练代码】目标检测、深度学习实战、狗类检测、犬种识别
基于YOLOv8深度学习的120种犬类检测与识别系统【python源码+Pyqt5界面+数据集+训练代码】目标检测、深度学习实战、狗类检测、犬种识别