论文再报喜讯,「增强现实中的显著性问题」入选ACMMM!

简介: ACM 国际多媒体大会(英文名称:ACM Multimedia,简称:ACM MM)是多媒体领域的顶级国际会议,每年举办一次。多媒体研究的重点是整合不同数字形式(包括图像,文本,视频,音乐,传感器数据,口头音频)提供的多种视角。自1993年以来,ACM多媒体一直将学术界和工业界的研究人员和从业人员汇聚在一起,提出创新的研究成果并讨论最新进展。会议的一个特别部分是艺术计划,该计划探索计算机科学与艺术的界限。


论文题目

Saliency in Augmented Reality 增强现实中的显著性问题


论文简介

随着多媒体技术的飞速发展,增强现实(AR)已成为具有发展前景的下一代移动平台。AR 背后的主要理论是人类视觉混淆,它允许用户通过将它们叠加在一起来同时感知现实世界场景和增强内容(虚拟世界场景)场景。要获得良好的体验质量(QoE),重要的是要了解两个场景之间的交互,并和谐地展示 AR 内容。然而目前关于这种叠加将如何影响人类视觉注意力的研究还是比较稀缺的。因此,在本文中,我们主要分析背景(BG)场景与 AR 内容之间的交互效果,研究 AR 中的显著性预测问题。具体来说,我们首先构建了一个 Saliency in AR Dataset (SARD),其中包含 450 个 BG 图像、450 个 AR 图像以及 1350 个通过将 BG 和 AR 图像以三个混合级别叠加生成的叠加图像。对 60 名受试者进行了大规模的眼动追踪实验,以收集眼动数据。为了更好地预测 AR 中的显性,我们提出了一种矢量量化显性预测方法,并将其推广到 AR 显性预测。为进行科学比较,我们提出了三种基准方法,并与我们在 SARD 上提出的方法一起进行了评估。实验结果证明了我们提出的方法在常见的显性预测问题和 AR 显性预测问题上均优于基准方法。我们的数据收集方法、数据集、基准方法和提出的显性模型将公开提供,以促进未来的研究。

论文提出的VQSal-AR模型框架图


论文作者

Huiyu Duan, Wei Shen, Xiongkuo Min, Danyang Tu, Jing Li, Guangtao Zhai


(论文为优酷摩酷实验室与上海交通大学合作)

相关文章
|
2月前
|
人工智能 安全 Linux
从零部署OpenClaw“龙虾AI”:Mac/Linux/Win11+阿里云搭建+百炼API配置+问题排查
OpenClaw(原名Clawdbot,圈内昵称“龙虾”)作为开源的AI Agent执行系统,实现了自然语言指令到电脑实际操作的转化,区别于传统聊天式AI,它能够直接接管本地操作权限完成邮件处理、文件整理、浏览器自动化等工作,成为当下提升工作效率的重要工具。2026年该工具迎来广泛应用,其部署方式也根据使用场景分化为本地部署与云端部署,同时国内大模型生态的适配让免费API对接成为可能。本文将详细讲解2026年OpenClaw在MacOS、Linux、Windows11的本地部署流程,阿里云云端部署步骤,以及阿里云百炼免费大模型API的配置方法,并对部署和使用中的常见问题进行解答,同时解析其核心
1507 3
|
5月前
|
存储 人工智能 前端开发
基于若依框架+AI的养老项目
中州养老系统是专为养老院打造的一体化管理软件,覆盖来访、入住、服务、财务等全流程。分管理后台与家属端,实现机构高效运营与家属便捷互动。技术上采用Vue3+Element Plus前端,若依+SpringBoot后端,MySQL+Redis存储,集成阿里云IOT、OSS及AI工具,助力智慧养老。
|
机器学习/深度学习 人工智能 Cloud Native
2024 天池云原生编程挑战赛决赛名单出炉,冠军来自中山大学、昆仑数智战队
2024 天池云原生编程挑战赛由阿里云主办,云原生应用平台、天池以及市场营销部联合承办,本届大赛成功吸引了超过 20500 支队伍积极参与,参赛者来自 10 多个国家和地区,大赛规模创下历史新高。
|
JavaScript Java API
Java日志通关(二) - Slf4j+Logback 整合及排包
作者日常在与其他同学合作时,经常发现不合理的日志配置以及五花八门的日志记录方式,后续作者打算在团队内做一次Java日志的分享,本文是整理出的系列文章第二篇。
|
数据采集 编解码 算法
Github | 推荐一个Python脚本集合项目
Github | 推荐一个Python脚本集合项目
502 5
|
数据采集 机器学习/深度学习 自然语言处理
如何提升模型对特定小语种的理解和生成能力?
如何提升模型对特定小语种的理解和生成能力?
|
JavaScript Java 关系型数据库
大学生就业招聘|基于Springboot和vue的大学生就业招聘系统设计与实现(源码+数据库+文档)
大学生就业招聘|基于Springboot和vue的大学生就业招聘系统设计与实现(源码+数据库+文档)
524 2
|
机器学习/深度学习 人工智能 自然语言处理
大语言模型的应用探索—AI Agent初探!
大语言模型的应用探索—AI Agent初探!
470 0
|
安全 Windows
命令提示符——CMD基础操作介绍
命令提示符——CMD基础操作介绍

热门文章

最新文章