SIGGRAPH 2023论文奖公布,山大、港大获奖,北大、腾讯光子获提名

简介: SIGGRAPH 2023论文奖公布,山大、港大获奖,北大、腾讯光子获提名

近日,计算机图形学及互交技术顶会 SIGGRAPH 2023 公布了今年的技术论文奖项。


自 50 年前举办第一次会议以来, Technical Papers program 一直是 SIGGRAPH 的核心。众多研究传播和讨论了动画、模拟、成像、几何、建模、渲染、人机交互、触觉、制造、机器人、可视化、音频、光学、编程语言、沉浸式体验和视觉计算机器学习等方面创新学术工作。


今年,共有 5 项研究获得了最佳论文奖,8 项研究获得了荣誉提名。这些论文因其研究的突出性和对计算机图形和交互技术研究的未来的新贡献而入选。


此外,ACM SIGGRAPH 今年首次设立时间检验奖,这些论文至少在十年内对计算机图形和交互技术产生了重要而持久的影响。时间检验奖委员会评审了 2011 年至 2013 年在 SIGGRAPH 会议上发表的论文,选出了 4 篇获奖论文。


最佳论文


论文 1:Split-Lohmann Multifocal Displays



论文链接:https://yingsiqin.github.io/assets/pdfs/SplitLohmann_SIGGRAPH23-lowres.pdf

机构:CMU

研究贡献:这项工作描述了一种近眼 3D 显示器,它可以瞬间创建一个虚拟世界,完全支持人眼关注不同距离内容的固有能力。这种能力使观看者能够以以前无法达到的沉浸水平体验 3D 视频和互动游戏。


论文 2:Differentiable Stripe Patterns for Inverse Design of Structured Surfaces



论文链接:https://arxiv.org/pdf/2305.13841.pdf

机构:苏黎世联邦理工学院

研究贡献:这项工作介绍了可微分条纹图案(Differentiable Stripe Patterns),一种用于自动设计具有条纹状、双材料分布的物理表面的计算方法,并提出了一个基于梯度的优化工具来自动计算最接近宏观力学性能目标的条纹图案。


论文 3:Globally Consistent Normal Orientation for Point Clouds by Regularizing the Winding-number Field



论文链接:https://arxiv.org/pdf/2304.11605.pdf

机构:山东大学、香港大学等

研究贡献:这项研究提出了一个平滑的目标函数来描述可接受的绕组数场的要求,它允许人们从一组完全随机的法向开始找到全局一致的法向。

论文 4:3D Gaussian Splatting for Real-time Radiance Field Rendering



论文链接:https://repo-sam.inria.fr/fungraph/3d-gaussian-splatting/3d_gaussian_splatting_low.pdf

机构:蔚蓝海岸大学、马克斯・普朗克计算机科学研究所

研究贡献:这项研究提出的方法允许实时渲染(>=30fps)具有高视觉质量的辐射场。该方法用 3D 高斯精确地表示了场景,允许有效的优化。其可见性感知渲染加速了训练,在同等质量的情况下,达到了与之前最快的方法一样的速度。额外一小时的训练就能提供 SOTA 质量。


论文 5:DOC: Differentiable Optimal Control for Retargeting Motions Onto Legged Robots


机构:迪士尼幻想工程研究中心,苏黎世联邦理工学院

研究贡献:这项研究提出了一个可微分最佳控制(DOC)框架,有助于计算关于用户定义参数的最佳控制和状态轨迹的分析导数。研究者通过将 mocap 和动画数据重新定位到一系列不同比例和质量分布的足式机器人上,证明了 DOC 的效用。


荣誉提名


论文 1:GestureDiffuCLIP: Gesture Diffusion Model With CLIP Latents、



论文链接:https://arxiv.org/pdf/2303.14613.pdf

机构:北京大学

研究贡献:这项研究介绍了 GestureDiffuCLIP,这是一个由 CLIP 指导的、与语音相关的手势合成系统,它利用任意的风格提示,创造出与语音语义和节奏相协调的风格化手势。该高度适应性系统支持短文、运动序列或视频片段形式的风格提示,并提供针对身体部位的风格控制。


论文 2:Word-as-image for Semantic Typography



论文链接:https://arxiv.org/pdf/2303.01818.pdf

机构:特拉维夫大学,伦敦大学,莱克曼大学

研究贡献:在「Word-as-image」技术中,词中图呈现了词的含义的可视化,同时也保留了其可读性。这项研究提出了一种自动创建「Word-as-image」插图的方法。在预训练的 Stable Diffusion 模型的指导下,该方法对每个字母的轮廓进行优化,以传达所需的概念。


论文 3:Sag-Free Initialization for Strand-Based Hybrid Hair Simulation



论文链接:https://graphics.cs.utah.edu/research/projects/sag-free-hair/sig23_sagfree-hair.pdf

机构:犹他大学,腾讯北美光子工作室(LightSpeed Studios)

研究贡献:本文提出了一个新颖的四阶段无下垂初始化框架,以解决混合型、基于股的头发动态系统的稳定准静态配置问题。结果表明,本文方法成功地防止了各种发型的下垂,并且最小化了模拟过程对头发运动的影响。


论文 4:Deployable Strip Structures



论文链接:https://www.geometrie.tuwien.ac.at/geom/ig/publications/deployable/deployable.pdf

机构:KAUST,ISTI-CNR 等

研究贡献:C-meshes 捕捉到了可从折叠状态部署的动能结构。它们享有丰富的几何结构和令人惊讶的微分几何关系,特别是具有线性 Weingarten 属性的表面,本文提供了设计和探索 C-meshes 形状空间的工具,并介绍了 architectural paneling 的应用。


论文 5:Towards Attention-Aware Rendering



论文链接:https://arxiv.org/pdf/2302.01368.pdf

机构:斯坦福大学,代尔夫特理工大学

研究贡献:现有的用于中心凹形(foveated graphics)的感知模型忽略了视觉注意力的影响,本文介绍了第一个对比敏感度的注意力感知模型,并激励了未来凹陷模型的发展,证明了当用户集中在凹陷处的任务时,对凹陷的容忍度会明显提高。


论文 6:Random-access Neural Compression of Material Textures



论文链接:https://arxiv.org/pdf/2305.17105.pdf

机构:英伟达

研究贡献:该论文提出了一种针对纹理贴图的神经压缩技术,在质量相当的情况下提供了明显优于 BCx 的压缩,甚至在低比特率下超过了熵编码的 AVIF 和 JPEG XL。该研究提出的方法使用小型的、优化的神经网络,以实现高效压缩、实时解压和在 GPU 上随机访问。


论文 7:Learning Physically Simulated Tennis Skills From Broadcast Videos



论文链接:https://research.nvidia.com/labs/toronto-ai/vid2player3d/data/tennis_skills_main.pdf

机构:斯坦福大学、英伟达等

研究贡献:该论文提出了一个系统,利用从网球视频中收集的大规模但质量较低的动作来学习多样化、复杂的网球技能,让模拟角色以高精确度将球打到目标位置,并成功进行了一系列包括击球和旋转的竞争型比赛。


论文 8:Min-Deviation-Flow in Bi-directed Graphs for T-Mesh Quantization



论文链接:https://www.algohex.eu/publications/bimdf-quantization/bimdf-quantization.pdf

机构:伯尔尼大学、牛津大学

研究贡献:T-Mesh 量化的整数优化是 SOTA 四边形网格(quad-meshing)方法的核心问题。该论文针对了双向网络中的最小偏差流问题(Minimum-DeviationFlow Problem in bi-directed networks,Bi-MDF)提出了一种快速近似求解器。


时间检验奖


论文 1:Functional Maps: A Flexible Representation of Maps Between Shapes (2012)



论文链接:https://damassets.autodesk.net/content/dam/autodesk/www/autodesk-reasearch/Publications/pdf/functional-maps-a-flexible.pdf

机构:巴黎综合理工学院、斯坦福大学

研究贡献:建立形状对之间的对应关系是形状推断和操作的基本步骤。该论文提出了一种称为 functional map 的表征形式,引发了大量关于形状匹配的后续研究。


论文 2:Eulerian Video Magnification for Revealing Subtle Changes in the World (2012)



论文链接:https://people.csail.mit.edu/mrub/papers/vidmag.pdf

机构:MIT CSAIL、Quanta Research Cambridge

研究贡献:这篇论文表明,相机可以捕捉微妙但重要的运动,这些运动对于人眼来说太微妙了。后续研究发现了许多应用领域,包括视频监控(video surveillance)、视觉振动测量(visual vibrometry)和视觉麦克风(visual microphone)。


论文 3:HDR-VDP-2: A Calibrated Visual Metric for Visibility and Quality Predictions in All Luminance Conditions (2011)



论文链接:https://www.cl.cam.ac.uk/~rkm38/pdfs/mantiuk11hdrvdp2.pdf

机构:班戈大学、首尔大学、不列颠哥伦比亚大学

研究贡献:该论文提出了在不同亮度条件下人类视觉校准模型的评估指标,该指标已成为预测各种强度图像的可见性和质量的默认标准指标。


论文 4:Optimizing Locomotion Controllers Using Biologically-based Actuators and Objectives (2012)



论文链接:https://nmbl.stanford.edu/publications/pdf/biolocomotion.pdf

机构:斯坦福大学

研究贡献:该论文提出一种在肌肉骨骼水平上模拟人体运动的创新方法,激发了看待人体运动及其模拟程度的新研究方向。


参考链接:https://blog.siggraph.org/2023/07/siggraph-2023-technical-papers-awards-best-papers-honorable-mentions-and-test-of-time.html/

相关文章
|
IDE JavaScript API
HarmonyOS开发第一步,熟知开发工具DevEco Studio
本文主要以常见的功能点作为概述希望可以帮助到学习HarmonyOS的开发者。
849 0
|
机器学习/深度学习 存储 算法
基于Flask+Bootstrap+机器学习的世界杯比赛预测系统
基于Flask+Bootstrap+机器学习的世界杯比赛预测系统
250 0
|
消息中间件 Cloud Native 物联网
深度剖析 RocketMQ 5.0,事件驱动:云时代的事件驱动有啥不同?
本文技术理念的层面了解一下事件驱动的概念。RocketMQ 5.0 在面向云时代的事件驱动架构新推出的子产品 EventBridge,最后再结合几个具体的案例帮助大家了解云时代的事件驱动方案。
79451 6
|
12月前
|
并行计算 PyTorch TensorFlow
Ubuntu安装笔记(一):安装显卡驱动、cuda/cudnn、Anaconda、Pytorch、Tensorflow、Opencv、Visdom、FFMPEG、卸载一些不必要的预装软件
这篇文章是关于如何在Ubuntu操作系统上安装显卡驱动、CUDA、CUDNN、Anaconda、PyTorch、TensorFlow、OpenCV、FFMPEG以及卸载不必要的预装软件的详细指南。
11007 4
|
8月前
|
机器学习/深度学习 人工智能 测试技术
扩散模型版CS: GO!世界模型+强化学习:2小时训练登顶Atari 100K
《Diffusion for World Modeling: Visual Details Matter in Atari》提出了一种名为DIAMOND的方法,将扩散模型应用于世界模型构建。该方法在Atari 100K基准测试中仅用2小时训练时间就达到了前所未有的性能水平,平均人类归一化分数达1.46,超过人类水平。DIAMOND通过条件生成、网络预条件和高效采样等设计,提升了视觉细节捕捉、模型稳定性和计算效率。未来研究方向包括连续控制领域应用和更长记忆机制的整合。
157 10
|
机器学习/深度学习 PyTorch 算法框架/工具
RNN、LSTM、GRU神经网络构建人名分类器(三)
这个文本描述了一个使用RNN(循环神经网络)、LSTM(长短期记忆网络)和GRU(门控循环单元)构建的人名分类器的案例。案例的主要目的是通过输入一个人名来预测它最可能属于哪个国家。这个任务在国际化的公司中很重要,因为可以自动为用户注册时提供相应的国家或地区选项。
|
11月前
|
人工智能 物联网 Shell
今日 AI 开源|共 12 项|开源的DIY健康追踪项目,基于低成本的智能戒指构建私人的健康监测应用
本文介绍了多个开源项目,涵盖了从量子计算错误纠正到视频生成和编辑的广泛应用领域。这些项目展示了AI技术在不同领域的创新和应用潜力。
704 10
今日 AI 开源|共 12 项|开源的DIY健康追踪项目,基于低成本的智能戒指构建私人的健康监测应用
|
11月前
|
JSON 测试技术 数据格式
Playwright 测试报告器
Playwright 测试报告器
389 4
|
12月前
|
机器学习/深度学习 人工智能 自然语言处理
前端大模型入门(三):编码(Tokenizer)和嵌入(Embedding)解析 - llm的输入
本文介绍了大规模语言模型(LLM)中的两个核心概念:Tokenizer和Embedding。Tokenizer将文本转换为模型可处理的数字ID,而Embedding则将这些ID转化为能捕捉语义关系的稠密向量。文章通过具体示例和代码展示了两者的实现方法,帮助读者理解其基本原理和应用场景。
3004 1
|
域名解析 缓存 运维
【域名解析DNS专栏】DNS解析策略:如何实现负载均衡与故障转移
【5月更文挑战第23天】DNS在互联网中扮演关键角色,将域名转换为IP地址。本文探讨DNS的负载均衡和故障转移技术,以增强服务可用性和性能。负载均衡包括轮询(简单分配流量)和加权轮询(按服务器处理能力分配)。故障转移通过主备策略和TTL值实现快速切换,确保服务连续性。实践案例展示了在电商网站如何应用这些策略。DNS策略优化可提升网站速度和稳定性,借助云服务和智能工具,DNS管理更加高效。
1632 1
【域名解析DNS专栏】DNS解析策略:如何实现负载均衡与故障转移