带你读《2022技术人的百宝黑皮书》——CVPR2022 | 开源: 基于间距自适应查找表的实时图像增强方法(5)

简介: 带你读《2022技术人的百宝黑皮书》——CVPR2022 | 开源: 基于间距自适应查找表的实时图像增强方法(5)

带你读《2022技术人的百宝黑皮书》——CVPR2022 | 开源: 基于间距自适应查找表的实时图像增强方法(4) https://developer.aliyun.com/article/1246792?groupCode=taobaotech



总结


在本文中,我们简要介绍了一种新颖的,可用于强化可学习 3D LUT 以进行实时颜色增强的学习机制——AdaInt。其中心思想是引入图像自适应采样间隔来学习非均匀的3D LUT布局。两个公开数据集的实验结果验证了方法在性能和效率方面优于其他先进的现有方法。此外,作者相信本文方法中所蕴含的思想,即对复杂的底层变换函数或表示进行非均匀采样的观点不仅局限于 3D LUTs,也有望指导其他应用的改进,我们将其留作我们未来的工作。


参考文献


[1] Liu Y, He J, Chen X, et al. Very lightweight photo retouching network with conditional sequential modulation[J]. arXiv preprint arXiv:2104.06279, 2021.


[2] Zeng H, Cai J, Li L, et al. Learning image-adaptive 3D lookup tables for high performance photo enhancement in real-time[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2020.


团队介绍


该工作主要在大淘宝技术中支持内容业务的音视频算法与基础技术团队的带领下完成,该团队依托淘宝直播、逛逛和点淘等内容业务,致力于打造行业领先的音视频技术。团队成员来自海内外知名高校,先后在MSU世界编码器大赛,NTIRE视频图像增强领域这样的领域强相关权威赛事上夺魁,并重视与学界的合作与交流。


本工作的色彩增强任务与团队实际业务场景中调色的功能需求密切相关。调色是淘宝主播提升直播间画质的重要手段之一,往往依赖专业人员以及配套软件,使用门槛和成本较高。我们的色彩增强工作,旨在自动化的帮助用户完成原本专业性强操作复杂度较高的调色工作,更好地帮助主播提升直播间画质,改善直播画质体验。


这项工作的主要合作方为上海交通大学张文军教授领衔的图像所团队,是数字电视广播及数字媒体处理与传输领域的主要研究力量之一。近年来,团队面向国家战略性新兴产业,顺应网络化、融合化的发展趋势,在包括智能媒体融合网络、视频智能分析处理与传输在内的多个重点研究领域开展工作,并取得了多项重大成果。

相关文章
|
数据采集 监控 网络协议
MES系统跟车间设备怎么连接?设备管理后的好处有哪些?
万界星空科技MES系统通过直接联网通信、工业网关采集和远程IO采集三种方式与车间设备连接,实现设备状态实时监控、统一管理、异常报警、故障记录和预防性维护。设备联网能提升生产效率,降低生产成本,推动数字化工厂建设。
812 2
|
关系型数据库 PostgreSQL Ruby
HTTP 502: Whoops, GitLab is taking too much time to respond.
最近有台云上的服务器需要释放,然后上面跑的 gitlab 也要挪个地方,如在 docker 内运行,gitlab 镜像大约 1.56G,需占用 4G 以上的内存,因资源有限,于是借在其他的服务器上搭建环境(可用内存小于4G),然鹅启动的时候莫名出现 502,Excuse me?接着搜了一些 issue 博客上的解决方案(如修改端口、重启或 hup 某个服务)无果,后来在调整的过程中从日志里发现了一些信息。
12584 0
|
存储 Java 程序员
菜鸟之路Day26一一Maven
本文由blue撰写,发布于2025年3月25日,主要介绍Maven工具的使用。Maven是Apache旗下的开源项目,用于管理和构建Java项目,基于项目对象模型(POM)概念。文章详细讲解了Maven的安装配置、IDEA中集成Maven的方法、依赖管理(包括依赖配置、传递与排除、依赖范围)、以及Maven的生命周期(clean、default、site)。通过学习,读者可掌握Maven的基本功能及其在项目中的应用。
555 12
|
C++ Windows
winform 程序打包成windows安装包
winform 程序打包成windows安装包前提:VS2019,winform 程序已经有一个完整可运行的 winform 程序。VS中上方扩展选项卡,选择 管理扩展,在打开的弹窗中选择联机,在右侧搜索框搜索 installer, 在中间显示的结果选择 Microsoft Visual Studio Installer Projects 点击下载。下载完成之后,关闭vs,自动打开扩展的安...
474 0
winform 程序打包成windows安装包
|
负载均衡 安全 应用服务中间件
nginx的强大功能和如何使用?
nginx的强大功能和如何使用?
784 2
|
机器学习/深度学习 自然语言处理 计算机视觉
【YOLOv8改进 - Backbone主干】VanillaNet:极简的神经网络,利用VanillaBlock降低YOLOV8参数
【YOLOv8改进 - Backbone主干】VanillaNet:极简的神经网络,利用VanillaBlock降低YOLOV8参数
利唐i人事、北森、Moka大比拼:谁才是HR数字化转型的最佳拍档?
在HR数字化转型中,选择合适的SaaS平台至关重要。利唐i人事、北森和Moka是市场上的热门选项。利唐i人事作为一站式HR管理平台,功能涵盖招聘、考勤、薪酬等多环节,操作便捷且性价比高,适合各规模企业;北森专注于人才管理,专业性强但学习成本高;Moka擅长招聘管理,但功能相对单一。综合来看,利唐i人事凭借全面性、友好体验和良好口碑,成为HR数字化转型的优选拍档。
|
存储 人工智能 供应链
光量子计算:计算速度的新突破
【9月更文挑战第17天】光量子计算利用光子的量子特性,突破传统计算瓶颈,展现强大信息处理能力。本文阐述了光量子计算原理,聚焦“九章三号”新进展:255光子高斯玻色取样,性能超越现有超级计算机亿亿倍。同时,展望其在优化问题解决、量子模拟、加密技术革新及人工智能加速上的应用前景,并讨论面临的挑战与未来技术发展的无限可能。
|
Linux 网络安全 数据处理
【专栏】Linux下的xxd命令是一个强大的二进制数据处理工具,用于十六进制转储和数据分析,我教你应该如何使用!
【4月更文挑战第28天】Linux下的xxd命令是一个强大的二进制数据处理工具,用于十六进制转储和数据分析。它可以显示文件的十六进制和ASCII表示,方便查看内容、分析数据结构和比较文件。xxd支持指定输出格式、写入文件、数据提取和转换等功能。在网络安全分析、程序调试和数据恢复等领域有广泛应用。通过掌握xxd,用户能更深入理解和处理二进制数据。
1889 0
|
机器学习/深度学习 数据采集 人工智能
AI技术实践:利用机器学习算法预测房价
人工智能(Artificial Intelligence, AI)已经深刻地影响了我们的生活,从智能助手到自动驾驶,AI的应用无处不在。然而,AI不仅仅是一个理论概念,它的实际应用和技术实现同样重要。本文将通过详细的技术实践,带领读者从理论走向实践,详细介绍AI项目的实现过程,包括数据准备、模型选择、训练和优化等环节。
1557 3