论文再报喜讯,「增强现实中的显著性问题」入选ACMMM!

简介: ACM 国际多媒体大会(英文名称:ACM Multimedia,简称:ACM MM)是多媒体领域的顶级国际会议,每年举办一次。多媒体研究的重点是整合不同数字形式(包括图像,文本,视频,音乐,传感器数据,口头音频)提供的多种视角。自1993年以来,ACM多媒体一直将学术界和工业界的研究人员和从业人员汇聚在一起,提出创新的研究成果并讨论最新进展。会议的一个特别部分是艺术计划,该计划探索计算机科学与艺术的界限。


论文题目

Saliency in Augmented Reality 增强现实中的显著性问题


论文简介

随着多媒体技术的飞速发展,增强现实(AR)已成为具有发展前景的下一代移动平台。AR 背后的主要理论是人类视觉混淆,它允许用户通过将它们叠加在一起来同时感知现实世界场景和增强内容(虚拟世界场景)场景。要获得良好的体验质量(QoE),重要的是要了解两个场景之间的交互,并和谐地展示 AR 内容。然而目前关于这种叠加将如何影响人类视觉注意力的研究还是比较稀缺的。因此,在本文中,我们主要分析背景(BG)场景与 AR 内容之间的交互效果,研究 AR 中的显著性预测问题。具体来说,我们首先构建了一个 Saliency in AR Dataset (SARD),其中包含 450 个 BG 图像、450 个 AR 图像以及 1350 个通过将 BG 和 AR 图像以三个混合级别叠加生成的叠加图像。对 60 名受试者进行了大规模的眼动追踪实验,以收集眼动数据。为了更好地预测 AR 中的显性,我们提出了一种矢量量化显性预测方法,并将其推广到 AR 显性预测。为进行科学比较,我们提出了三种基准方法,并与我们在 SARD 上提出的方法一起进行了评估。实验结果证明了我们提出的方法在常见的显性预测问题和 AR 显性预测问题上均优于基准方法。我们的数据收集方法、数据集、基准方法和提出的显性模型将公开提供,以促进未来的研究。

论文提出的VQSal-AR模型框架图


论文作者

Huiyu Duan, Wei Shen, Xiongkuo Min, Danyang Tu, Jing Li, Guangtao Zhai


(论文为优酷摩酷实验室与上海交通大学合作)

目录
打赏
0
0
0
0
1028
分享
相关文章
Nature重磅研究:AlphaFold绘制病毒族谱,揭开身世之谜
【10月更文挑战第14天】AlphaFold,由DeepMind开发的深度学习模型,不仅在蛋白质结构预测上取得突破,还成功绘制了病毒的族谱。通过预测病毒基因组的蛋白质结构,AlphaFold揭示了病毒进化的重要规律,提供了更准确的病毒分类系统,为病毒的起源、传播和防控研究提供了新工具。
70 3
蚁群、蜂群的智慧,大模型也可以有,谷歌等机构群体智能研究亮相
蚁群和蜂群以其独特的群体智能行为著称,如分布式决策、自组织性和鲁棒性。这些特性启发了科学家将群体智能原理应用于大模型的构建,以实现更高效、更智能的系统。谷歌等机构已通过模拟这些行为,开发出如“蚁群优化”算法等成果,显著提高了计算效率和系统的鲁棒性。然而,群体智能的应用仍面临通信协调、个体差异性和可解释性等挑战。
99 3
AI小分子药物发现的百科全书,康奈尔、剑桥、EPFL等研究者综述登Nature子刊
【7月更文挑战第12天】康奈尔、剑桥及EPFL科学家合作,详述AI在药物发现中的突破与挑战[^1]。AI现用于新化合物生成、现有药物优化及再利用,加速研发进程。尽管取得进展,可解释性不足、数据质量和伦理监管仍是待解难题。 [^1]: [论文链接](https://www.nature.com/articles/s42256-024-00843-5)
105 3
自动驾驶理论新突破登Nature子刊!清华、密歇根联合提出三条技术路线,剑指稀疏度灾难
【7月更文挑战第6天】清华大学与密歇根大学研究团队在Nature子刊发表突破性成果,针对自动驾驶的“稀疏度灾难”提出三条技术路线:数据驱动、模型驱动及混合驱动,旨在提升系统应对罕见场景的能力,确保安全性和鲁棒性。这一进展为解决自动驾驶在复杂环境中的决策难题开辟了新途径。[论文链接](https://doi.org/10.1038/s41467-024-49194-0)**
109 3
ICLR 2024 Spotlight:单模型斩获蛋白质突变预测榜一!西湖大学提出基于结构词表方法
【6月更文挑战第1天】西湖大学团队研发的蛋白质语言模型SaProt,在结构词表方法下,于蛋白质突变预测任务中荣登榜首。SaProt利用Foldseek编码的结构标记理解蛋白质行为,超越现有基准模型,在10个下游任务中表现出色。尽管训练资源需求大,且有特定任务优化空间,但该模型为生物医学研究带来新工具,促进科学理解与合作。论文链接:[https://www.biorxiv.org/content/10.1101/2023.10.01.560349v4](https://www.biorxiv.org/content/10.1101/2023.10.01.560349v4)
281 7
为自动驾驶汽车创造「记忆」,上交校友、康奈尔大学博士生三篇论文被CVPR 2022收录
为自动驾驶汽车创造「记忆」,上交校友、康奈尔大学博士生三篇论文被CVPR 2022收录
225 0
史上首次,强化学习算法控制核聚变登上Nature:DeepMind让人造太阳向前一大步
史上首次,强化学习算法控制核聚变登上Nature:DeepMind让人造太阳向前一大步
236 0
图像分割二十年,盘点影响力最大的10篇论文
【新智元导读】图像分割(image segmentation)技术是计算机视觉领域的个重要的研究方向,近些年,图像分割技术迅猛发展,在多个视觉研究领域都有着广泛的应用。本文盘点了近20年来影响力最大的 10 篇论文。
516 0
图像分割二十年,盘点影响力最大的10篇论文