CVPR 2024:合成视频数据集里只有单人数据?M3Act破解人群行为标注难题

简介: 【6月更文挑战第12天】CVPR 2024上的M3Act数据集解决了复杂人群行为标注难题,提供多视角、多群体的合成视频数据,助力计算机视觉研究。利用Unity引擎生成高度真实的人类动作和群体活动,促进以人类为中心任务的学习。实验显示,M3Act能提升目标检测等任务性能,降低数据收集成本,并支持3D群体活动的可控生成。尽管面临数据复杂性、偏差和计算资源限制等问题,M3Act为相关研究提供了宝贵资源。[论文链接](https://arxiv.org/abs/2306.16772)

在计算机视觉领域,对复杂人类交互和群体活动的学习研究已经成为一个重点。然而,由于从真实场景中获取大规模标注数据集的挑战,相关任务的进展常常受到阻碍。为了解决这一限制,研究人员在CVPR 2024上提出了一种名为M3Act的新型数据集,用于生成多视角、多群体、多人物的人类原子动作和群体活动。

M3Act是由Unity引擎驱动的,它具有多个语义群体、高度多样化和逼真的图像以及全面的标注集,这些都有助于在单人、多人和多群体条件下学习以人类为中心的任务。这个数据集的引入为研究人员提供了一个宝贵的资源,使他们能够训练和测试他们的模型,而无需依赖昂贵且难以获取的真实世界数据。

研究人员通过三个核心实验展示了M3Act的优势。首先,他们发现使用M3Act数据集可以显著提高几个下游方法的性能,包括目标检测、实例分割和动作识别。这表明M3Act可以有效地用于预训练模型,然后在真实世界的数据上进行微调,以获得更好的性能。

其次,研究人员发现M3Act可以替代真实世界的数据集,从而降低成本。由于M3Act可以生成大规模的标注数据,研究人员可以避免花费时间和资源来收集和标注他们自己的数据集。这对于那些没有足够资源来收集大规模真实世界数据集的研究人员来说尤其重要。

最后,研究人员发现M3Act可以用于生成可控的3D群体活动。他们定义了多个指标,并提出了一个有竞争力的基准方法来解决这个新任务。这为研究人员提供了一个平台,可以在这个平台上开发新的算法和技术,以生成更逼真和多样化的群体活动。

然而,尽管M3Act具有许多优点,但也存在一些潜在的局限性。首先,尽管M3Act可以生成大规模的标注数据,但这些数据可能无法完全捕捉到真实世界中的所有复杂性和多样性。其次,将M3Act生成的数据用于训练模型可能会引入一些偏差,因为这些数据可能与真实世界的数据存在差异。

此外,M3Act的生成过程可能需要大量的计算资源,这可能会限制其在资源受限的环境中的应用。最后,M3Act目前只关注人类行为和群体活动,而没有考虑其他类型的数据,如环境和对象。

论文链接:https://arxiv.org/abs/2306.16772

目录
相关文章
|
4月前
合成生物学:设计合成微生物组
【10月更文挑战第5天】合成生物学作为一门新兴的生物科学分支,正在为生物科学研究和技术应用带来革命性的变化。通过设计和合成微生物组,我们可以创造出具有特定功能的生物系统,为多个领域提供新的解决方案和可能性。随着技术的不断进步和应用领域的拓展,合成生物学必将在未来发挥更加重要的作用。
108 22
|
6月前
|
数据采集 机器学习/深度学习 人工智能
【2021 第五届“达观杯” 基于大规模预训练模型的风险事件标签识别】1 初赛Rank12的总结与分析
关于2021年第五届“达观杯”基于大规模预训练模型的风险事件标签识别竞赛的初赛Rank12团队的总结与分析,详细介绍了赛题分析、传统深度学习方案、预训练方案、提分技巧、加速训练方法以及团队的总结和反思。
66 0
|
计算机视觉
ELITE项目原作解读:基于扩散模型的快速定制化图像生成
ELITE项目原作解读:基于扩散模型的快速定制化图像生成
160 0
|
机器学习/深度学习 人工智能 数据可视化
MIT设计深度学习框架登Nature封面,预测非编码区DNA突变
MIT设计深度学习框架登Nature封面,预测非编码区DNA突变
135 0
|
机器学习/深度学习 人工智能 数据可视化
AAAI 2022 Oral | 无需人工标注,清华、快手提出基于参考图像的单张生成图像质量评价方法
AAAI 2022 Oral | 无需人工标注,清华、快手提出基于参考图像的单张生成图像质量评价方法
128 0
|
人工智能 算法 计算机视觉
CVPR 2022 | 16万视频对、28万对片段,蚂蚁开源视频侵权检测超大数据集(2)
CVPR 2022 | 16万视频对、28万对片段,蚂蚁开源视频侵权检测超大数据集
158 0
|
机器学习/深度学习 编解码 自然语言处理
只需2040张图片,训练视觉Transformer:南大吴建鑫团队提出IDMM
只需2040张图片,训练视觉Transformer:南大吴建鑫团队提出IDMM
193 0
|
机器学习/深度学习 算法 计算机视觉
让换脸无所遁形!南洋理工发布全球首个DeepFake篡改序列检测还原数据集|ECCV 2022
让换脸无所遁形!南洋理工发布全球首个DeepFake篡改序列检测还原数据集|ECCV 2022
179 0
|
机器学习/深度学习 人工智能 计算机视觉
ResNets首次反超有监督学习!DeepMind用自监督实现逆袭,无需标注
ResNets首次反超有监督学习!DeepMind用自监督实现逆袭,无需标注
145 0