视觉生产技术的探索应用

本文涉及的产品
视觉智能开放平台,视频通用资源包5000点
视觉智能开放平台,分割抠图1万点
视觉智能开放平台,图像通用资源包5000点
简介: 阿里云视觉平台是基于阿里巴巴视觉智能技术实践经验,面向视觉智能技术企业和开发商(含开发者),为其提供高易用、普惠的视觉API服务,帮助企业快速建立视觉智能技术的应用能力的综合性视觉AI能力平台。

视觉生产

定义

通过一个或一系列视觉过程,产生新的视觉表达。
1.png

分类

生成:从0到1
拓展:从1到N
摘要:从N到1
升维:从An到An+1

通用框架

3.png

视觉生产五个关键维度

  1. 满足视觉美学表现,可看
  2. 合乎语义内容逻辑
  3. 保证结果丰富性
  4. 提供用户预期的抓手,可控
  5. 带来用户和商业价值
    4.png

具体细节的一些理解

视觉分割是生产的必要前置步骤,唯有理解方能生成。
识别:知道是什么
111.png

检测:识别+知道在哪里
5.png

分割:识别+检测
222.png

分割抠图的难点

复杂背景
遮挡
发丝精扣
边缘反色
透明材质
多尺度,多目标

数据严重不住,标注成本高

分割抠图的解绝
语义分割
实例分割
image matting
6.png

分割抠图 模型框架
step1 mask粗分割
step2 mask质量统一
step3 估计精确alpha

分割抠图 抠图扩展
人像-分割不同区域
7.png

物体抠图
8.png

场景
9.png

视觉生成

平面图像设计生成——鹿班

框架流程:
需求-草图-选状态-调细节-生成-评价
样例:电商需求设计,照图生图,个性化设计,智能美工,

视频生成——AlibabaWood

框架流程:
素材准备-基础特效-智能特效-智能编排
样例:视频封面,商品展示

视觉编辑

视频的增删查改
视频植入:广告位检测定位,广告位跟踪,遮挡,透视,素材匹配,光影渲染
333.png

动态检测分割

视频内容擦除
擦除字幕,台标,广告,场景文字
流程:
定位-分割-充填-训练
11.png

画幅变化

视频画幅变化:主体检测分割+背景拉伸+背景补全+智能构图裁剪+超分辨率=多保留有效画面
图像尺寸变化

视觉增强

主要包括:人脸增强,去噪声,通用场景超分,LDR升HDR,视频插帧等
人脸增强
12.png

场景超分
13.png

颜色扩展
14.png

视觉制造

包装设计
服装设计:3d,材质工艺,纹理图案迁移,流行色,背景融合
15.png

目录
相关文章
|
云安全 存储 安全
一文看全数据跨境合规
于9月1日正式实施的《数据安全法》再次加码数据出境安全。 基于8月27日《数据安全法》解读与阿里云三大合规方案线上直播活动,阿里云解决方案架构师锅涛分享的《数据跨境流转安全》主题内容,整理出数据出境安全的九问九答,为企业数据跨境流转送上安全锦囊。
1398 0
一文看全数据跨境合规
|
10月前
|
消息中间件 缓存 Java
java nio,netty,kafka 中经常提到“零拷贝”到底是什么?
零拷贝技术 Zero-Copy 是指计算机执行操作时,可以直接从源(如文件或网络套接字)将数据传输到目标缓冲区, 而不需要 CPU 先将数据从某处内存复制到另一个特定区域,从而减少上下文切换以及 CPU 的拷贝时间。
java nio,netty,kafka 中经常提到“零拷贝”到底是什么?
|
11月前
|
算法 大数据 数据库
云计算与大数据平台的数据库迁移与同步
本文详细介绍了云计算与大数据平台的数据库迁移与同步的核心概念、算法原理、具体操作步骤、数学模型公式、代码实例及未来发展趋势与挑战。涵盖全量与增量迁移、一致性与异步复制等内容,旨在帮助读者全面了解并应对相关技术挑战。
311 3
|
关系型数据库 MySQL 应用服务中间件
Nginx、Mysql8、Openjdk11/17安装
Nginx、Mysql8、Openjdk11/17安装
1020 89
Nginx、Mysql8、Openjdk11/17安装
|
Web App开发 资源调度 网络协议
RTS 与 FreeSWITCH
这篇文章介绍了RTS(Real-Time Switch),一个FreeSWITCH的衍生品,它提供了稳定发行版、实用默认配置、新特性、国产化适配、改进的控制接口和UI等,同时讨论了RTS的默认编译模块调整、禁用Stun功能、增加的RTP相关函数、WebRTC Media Bundle支持、HTTP相关函数增加、默认禁用自动NAT、Windows编译问题解决、录音文件权限修改、mod_httapi和mod_logfile模块优化,以及文档贡献和国内访问GitHub的方法。
343 0
|
Java
Java一分钟之-多态性:理解重写与接口
【5月更文挑战第9天】本文介绍了Java中的多态性,主要通过方法重写和接口实现。重写允许子类根据实际类型执行不同实现,关键点包括方法签名相同、访问权限不降低以及final、static和abstract方法不可重写。接口是抽象类型,包含抽象方法,提供另一种多态性实现。常见问题包括混淆重载与重写、不理解动态绑定以及滥用接口。为避免问题,需明确重写目的、合理设计接口,并在使用多态时注意类型检查。多态性是提升代码质量和灵活性的关键。
226 1
|
JavaScript
Vue 定义只读数据 readonly 与 shallowReadonly
Vue 定义只读数据 readonly 与 shallowReadonly
179 0
|
数据采集 JavaScript 前端开发
深入网页分析:利用scrapy_selenium获取地图信息
网页爬虫是一种自动获取网页内容的技术,它可以用于数据采集、信息分析、网站监测等多种场景。然而,有些网页的内容并不是静态的,而是通过JavaScript动态生成的,例如图表、地图等复杂元素。这些元素往往需要用户的交互才能显示出来,或者需要等待一定时间才能加载完成。如果使用传统的爬虫技术,如requests或urllib,就无法获取到这些元素的内容,因为它们只能请求网页的源代码,而不能执行JavaScript代码。我们可以使用scrapy_selenium这个工具,它结合了scrapy和selenium两个强大的库,可以实现对动态网页的爬取。
260 0
深入网页分析:利用scrapy_selenium获取地图信息
|
搜索推荐 应用服务中间件 nginx
typecho joe主题优化日志
博主使用了typecho进行博客网站的建立,也进行了一定程度上的修改优化。可从本文看到一系列美化方法。配置为 typecho1.2 php7.4
293 0
typecho joe主题优化日志
|
存储 数据采集 搜索推荐
多搜索引擎关键词采集域名采集URL采集联系信息采集工具
Msray-plus,是一款采用GO语言开发的企业级综合性爬虫/采集软件。 支持:搜索引擎结果采集、域名采集、URL采集、网址采集、全网域名采集、CMS采集、联系信息采集 支持亿级数据存储、导入、重复判断等。无需使用复杂的命令,提供本地WEB管理后台对软件进行相关操作,功能强大且简单易上手! 1:可从国内外多个搜索引擎批量采集用户导入的关键词对应的搜索结果(SERP数据),并进行结构化数据存储与自定义过滤处理; 2:可从用户提供的url种子地址,源源不断的自动爬取全网网站数据,并进行结构化数据存储与自定义过滤处理; 3:可从用户提供的网站列表数据中,全自动的提取出网站联系方式信息,
多搜索引擎关键词采集域名采集URL采集联系信息采集工具