视觉训练营day1——视觉生产技术

简介: 视觉训练营day1——视觉生产技术 笔记

定义和分类

视觉生产的定义

通过一个/一系列的视觉过程,产生出新的视觉表达
要求是和输入不一样的图像视频产出

视觉生产的分类

生产: 从0到1
拓展:从1到N
摘要:从N到1
升维:从An到An+1
增强/变换: 从A到B
插入/合成:A+B=C
擦除:A-B=C

视觉生产的五个关键维度

  • 可看 满足视觉/美学表现
  • 合理 合乎语义/内容逻辑
  • 多样 保证结果的丰富性
  • 可控 提供用户预期的抓手
  • 可用 带来用户/商业的价值

精细理解

分割抠图

  • 识别
  • 检测
  • 分割
分割抠图难点
  • 复杂背景、遮挡、发丝精扣、边缘反色、透明材质、多尺度/目标
  • 数据严重不足,标注成本高
分割抠图模型框架

1.mask粗分割
2.mask质量统一
3.精确到alpha

分割抠图应用场景
  • 头发丝
  • 相似背景
  • 其他物体抠图

视觉生成

image.png

鹿斑

image.png

alibabawood

image.png

视觉编辑

视频植入

image.png

视频内容擦除

image.png
image.png

视频画幅变化

image.png

视觉增强

image.png

  • 人脸视觉增强
  • 视频超分
  • 视频插帧
  • HDR色彩扩展
  • 风格迁移
  • 颜色拓展

视觉制造

  • image.png

视觉开放平台

image.png

相关文章
|
存储 监控 算法
|
AI芯片
AIGC视频生成/编辑技术调研报告
随着图像生成领域的研究飞速发展,基于diffusion的生成式模型取得效果上的大突破。在图像生成/编辑产品大爆发的今天,视频生成/编辑技术也引起了学术界和产业界的高度关注。该分享主要介绍视频生成/编辑的研究现状,包括不同技术路线的优劣势,以及该领域当下面临的核心问题与挑战。
2086 3
AIGC视频生成/编辑技术调研报告
|
8月前
|
数据可视化 机器人 Java
聊天软件自动回复脚本,微信抖音快手小红书,消息自动回复工具机器人【java】
包含4个完整模块:主逻辑模块实现核心回复功能,工具模块封装常用函数,UI模块提供可视化控制界面
|
12月前
|
关系型数据库 分布式数据库 数据库
首届全国大学生计算机系统能力大赛PolarDB数据库创新设计赛(天池杯)圆满收官
首届全国大学生计算机系统能力大赛PolarDB数据库创新设计赛(天池杯)圆满收官
384 1
|
8月前
|
运维 监控 关系型数据库
从崩溃到高可用:基于DAS自治服务的RDS全链路故障自愈实战
本文分享了基于DAS自治服务实现RDS全链路故障自愈的实战经验。通过三级健康检查、智能决策引擎与幂等执行器,构建高可用数据库系统,显著提升故障恢复效率,降低业务中断风险,助力企业实现稳定可靠的数据库服务运维。
208 11
|
前端开发 容器
CSS 居中技术完全指南:从基础到高级应用
本文详细介绍了 CSS 中常用的居中方法,涵盖水平居中、垂直居中及同时实现两者的方法。
1190 12
|
JavaScript 前端开发
vue element plus Upload 上传
vue element plus Upload 上传
462 0
|
编解码 JavaScript 前端开发
【专栏】介绍了字符串Base64编解码的基本原理和在Java、Python、C++、JavaScript及Go等编程语言中的实现示例
【4月更文挑战第29天】本文介绍了字符串Base64编解码的基本原理和在Java、Python、C++、JavaScript及Go等编程语言中的实现示例。Base64编码将24位二进制数据转换为32位可打印字符,用“=”作填充。文中展示了各语言的编码解码代码,帮助开发者理解并应用于实际项目。
635 1
|
机器学习/深度学习 编解码 算法
【阿里云OpenVI-视觉生产系列之图片上色】照片真实感上色算法DDColor ICCV2023论文深入解读
图像上色是老照片修复的一个关键步骤,本文介绍发表在 ICCV 2023 上的最新上色论文 DDColor
4102 11
【阿里云OpenVI-视觉生产系列之图片上色】照片真实感上色算法DDColor ICCV2023论文深入解读