视觉生产技术的探索应用

简介: 阿里云视觉平台是基于阿里巴巴视觉智能技术实践经验,面向视觉智能技术企业和开发商(含开发者),为其提供高易用、普惠的视觉API服务,帮助企业快速建立视觉智能技术的应用能力的综合性视觉AI能力平台。

视觉生产

定义

通过一个或一系列视觉过程,产生新的视觉表达。
1.png

分类

生成:从0到1
拓展:从1到N
摘要:从N到1
升维:从An到An+1

通用框架

3.png

视觉生产五个关键维度

  1. 满足视觉美学表现,可看
  2. 合乎语义内容逻辑
  3. 保证结果丰富性
  4. 提供用户预期的抓手,可控
  5. 带来用户和商业价值
    4.png

具体细节的一些理解

视觉分割是生产的必要前置步骤,唯有理解方能生成。
识别:知道是什么
111.png

检测:识别+知道在哪里
5.png

分割:识别+检测
222.png

分割抠图的难点

复杂背景
遮挡
发丝精扣
边缘反色
透明材质
多尺度,多目标

数据严重不住,标注成本高

分割抠图的解绝
语义分割
实例分割
image matting
6.png

分割抠图 模型框架
step1 mask粗分割
step2 mask质量统一
step3 估计精确alpha

分割抠图 抠图扩展
人像-分割不同区域
7.png

物体抠图
8.png

场景
9.png

视觉生成

平面图像设计生成——鹿班

框架流程:
需求-草图-选状态-调细节-生成-评价
样例:电商需求设计,照图生图,个性化设计,智能美工,

视频生成——AlibabaWood

框架流程:
素材准备-基础特效-智能特效-智能编排
样例:视频封面,商品展示

视觉编辑

视频的增删查改
视频植入:广告位检测定位,广告位跟踪,遮挡,透视,素材匹配,光影渲染
333.png

动态检测分割

视频内容擦除
擦除字幕,台标,广告,场景文字
流程:
定位-分割-充填-训练
11.png

画幅变化

视频画幅变化:主体检测分割+背景拉伸+背景补全+智能构图裁剪+超分辨率=多保留有效画面
图像尺寸变化

视觉增强

主要包括:人脸增强,去噪声,通用场景超分,LDR升HDR,视频插帧等
人脸增强
12.png

场景超分
13.png

颜色扩展
14.png

视觉制造

包装设计
服装设计:3d,材质工艺,纹理图案迁移,流行色,背景融合
15.png

目录
相关文章
|
编解码 ice
PIE-engine 教程 ——MODIS影像去云教程(山西省为例)
PIE-engine 教程 ——MODIS影像去云教程(山西省为例)
867 0
PIE-engine 教程 ——MODIS影像去云教程(山西省为例)
|
人工智能 自然语言处理 Java
为什么越来越多企业用阿里云发短信?稳定、合规、高到达率的背后
短信仍是企业触达用户的“最后一公里”,阿里云短信服务凭借合规报备、99%高到达率、失败不计费及透明计价等优势,成为电商、物流、政务等行业首选。开发友好,10分钟快速接入,助力企业稳定高效通信。
564 0
|
2月前
|
存储 关系型数据库 MySQL
【数据库】NewSQL:TiDB & OceanBase核心知识体系:分布式架构、核心原理、分布式事务实现、HTAP(附《 TiDB & OceanBase 面试核心考点速记清单 》)
本文系统梳理TiDB与OceanBase两大NewSQL标杆的核心知识体系,涵盖设计理念、分布式架构、事务机制、HTAP原理及能力对比,聚焦Share-Nothing架构、强一致共识(Raft/Paxos)、全局时间戳、MVCC与原生HTAP等关键技术,助力高效选型与深度实践。
|
3月前
|
网络协议 安全 测试技术
api工具apifox、apipost选择
Apifox 与 Apipost 各有侧重:Apifox 是面向中大型团队的一站式 API 全生命周期管理平台,强在协作、自动化与流程闭环;Apipost 则以多协议调试(gRPC/TCP/WebSocket)、离线能力及小团队友好性见长。选型需结合团队规模、协议需求与安全要求。(239字)
483 2
|
7月前
|
数据采集 人工智能 算法
美团 LongCat 团队发布全模态一站式评测基准UNO-Bench:揭示单模态与全模态能力的组合规律
美团LongCat团队推出一站式全模态大模型评测基准UNO-Bench,首创“组合定律”揭示多模态能力协同增益,支持中文场景,以98%跨模态问题占比和创新多步开放式题型,科学评估模型真实融合能力。
799 5
|
编解码 前端开发 UED
如何巧妙利用CSS3,打造炫酷视觉效果
在使用CSS3打造炫酷视觉效果时,要注意适度使用,避免过度设计导致页面过于复杂和混乱,影响用户的阅读和浏览体验。同时,要确保所使用的效果在不同的浏览器和设备上具有良好的兼容性,以提供一致的视觉效果。
556 137
|
JSON 监控 API
深度解析淘宝天猫店铺所有商品API接口,一文带你吃透
本文介绍如何通过淘宝开放平台的API获取店铺所有商品信息,适用于电商数据分析、竞品监控等场景。核心接口为`tb.items.onsale.get`(出售中商品)和`tb.items.inventory.get`(库存商品列表)。接口采用HTTP POST请求,返回JSON格式数据,包含商品总数、列表及各商品的ID、标题、价格、图片URL等关键信息,并提供Python实现示例,助力开发者高效获取与处理数据。
|
存储 人工智能 Cloud Native
小鹏汽车选用阿里云PolarDB,开启AI大模型训练新时代
PolarDB-PG云原生分布式数据库不仅提供了无限的扩展能力,还借助丰富的PostgreSQL生态系统,统一了后台技术栈,极大地简化了运维工作。这种强大的组合不仅提高了系统的稳定性和性能,还为小鹏汽车大模型训练的数据管理带来了前所未有的灵活性和效率。
|
JSON API 数据格式
mxget 的Python实现,优雅地下载你喜欢的音乐
mxget 的Python实现,优雅地下载你喜欢的音乐
|
运维 Kubernetes 负载均衡
拥抱Kubernetes,再见了SpringCloud
拥抱Kubernetes,再见了SpringCloud
1199 0
拥抱Kubernetes,再见了SpringCloud