【AI版狄仁杰】爱丁堡大学团队教AI识别犯罪剧中的罪犯,正确率达60%仍不及人类

简介: 爱丁堡大学的研究人员通过《犯罪现场调查》系列电视剧的相关视频、音频和文本训练AI,测试AI能否准确识别每集中的罪犯。在每集电视剧结束前10分钟,AI达到了60%的识别准确率,而人类的准确率达85%。

马路的尽头竟然有一具尸体,凶手是谁?或许AI可以解决这个问题。

Lea Frermann是爱丁堡大学的一名博士后研究员,她所在的团队通过《犯罪现场调查》系列电视剧的相关视频、音频和文本训练AI学习识别每一集中的罪犯。

7ad7830ee79fd8f6a4ddc746e3f421e69c764a6b

AI识别犯罪剧中罪犯,准确率达60%

研究人员将五季《犯罪现场调查》(共39集,59个案件)的录像、脚本和背景音映射成电脑可以读取的格式。数据被输入到一个计算机模型中,随着每个事件的展开,AI学习如何处理情节,并不断修正罪犯的身份。

在每集电视剧结束前10分钟,AI达到了60%的识别准确率,而人类的准确率达85%。

Frermann表示,“虽然人类识别犯罪者的准确率更高,但人类也更谨慎。”而团队设计的模型则能更大胆地进行识别。

Frermann解释了团队的研究目的:在给定足够数据的情况下是否可以训练一个AI系统来解决人类难以解决的问题。

10月底,团队在Transactionsof the Association for Computational Linguistics学术期刊上发表了他们的研究成果,并邀请其他学术界人士继续深入研究他们的发现。Frermann说,“我们希望我们的研究结果将有助于开发能实时接收大量信息的机器。”

根据Frermann所说,很大程度上,团队很满意他们通过《犯罪现场调查》训练AI系统所得到的结果。“对电脑来说,在电视节目中识别出罪犯,是一件非常艰巨的任务。但我们的模型表现得非常好。”

Frermann并不认为仅用更多数据便能提高预测准确率。她说,“我认为我们需要认真思考如何让这个模型可以访问其他信息。人类拥有如此多的世界知识,很难在一台机器上进行彻底编码。我们需要给模型配上更好的背景知识和更好的推理策略。我不认为只是抛出更多非结构化的数据能让我们走得更远。海量数据只能起一点点作用。

论文摘要

“在本文中,我们认为以《犯罪现场调查》为例的电视节目是一个理想的试验平台,可以接近真实世界的自然语言理解和与之相关的复杂推论。我们建议把犯罪剧当作一个新的推理任务,利用每个事件提出相同的基本问题(即“谁犯了罪?”),在罪犯被揭露时提供答案。我们开发了一个基于《犯罪现场调查》剧集的新数据集,将罪犯身份确定为序列标签问题,并开发了一个基于LSTM的模型,该模型可从多模态数据中学习。实验结果表明,增量推理策略是准确预测的关键,也是融合文本、视觉和声音输入的表征学习的关键。”

983f9379a30a73c8f014a16e74b7d799e7a39bc2


原文发布时间为:2017-12-19

本文作者:常佩琦

本文来自云栖社区合作伙伴新智元,了解相关信息可以关注“AI_era”微信公众号

原文链接:【AI版狄仁杰】爱丁堡大学团队教AI识别犯罪剧中的罪犯,正确率达60%仍不及人类

相关文章
|
5月前
|
人工智能 安全 搜索推荐
北大计算机学院再登国际AI顶刊!张铭教授团队揭露医疗AI致命漏洞
【10月更文挑战第17天】北京大学计算机学院张铭教授团队在国际顶级人工智能期刊上发表重要成果,揭示了医疗AI系统中的致命漏洞——“模型反演”。该漏洞可能导致误诊和医疗事故,引起学术界和工业界的广泛关注。研究强调了医疗AI系统安全性评估的重要性。
72 1
|
3月前
|
传感器 人工智能 安全
杨笛一团队:一个弹窗,就能把AI智能体操控电脑整懵了
杨笛一团队最新研究揭示,简单弹窗可操控AI智能体,使其在执行任务时陷入混乱。实验显示,在OSWorld和VisualWebArena环境中,攻击成功率分别达86%和60%以上。该发现强调了AI安全的重要性,提醒我们在享受AI便利的同时需警惕潜在风险。研究指出,弹窗设计中的四个关键要素(注意力钩子、指令、信息横幅、ALT描述符)对攻击成功至关重要,并建议通过安全训练、人类监督和环境感知提升防御能力。
74 13
|
3月前
|
人工智能
带上团队一起来做 AI 编程实践丨通义灵码联合TGO鲲鹏会开启 AI 大课
带上团队一起来做 AI 编程实践丨通义灵码联合TGO鲲鹏会开启 AI 大课
|
3月前
|
人工智能 自然语言处理 数据挖掘
田渊栋团队新作祭出Agent-as-a-Judge!AI智能体自我审判,成本暴跌97%
田渊栋团队提出Agent-as-a-Judge框架,利用智能体自身评估其他智能体的性能,不仅关注最终结果,还能提供中间反馈,更全面准确地反映智能体的真实能力。该框架在DevAI基准测试中表现出色,成本效益显著,为智能体的自我改进提供了有力支持。
84 7
|
4月前
|
机器学习/深度学习 人工智能 自然语言处理
o1医学领域大胜GPT-4,性能暴涨!顶尖华人团队激动发文:离AI医生越来越近了
【10月更文挑战第29天】近日,一支顶尖华人团队发布论文《A Preliminary Study of o1 in Medicine: Are We Closer to an AI Doctor?》,揭示了OpenAI最新语言模型o1在医学领域的卓越表现。研究显示,o1在概念识别、文本总结、问答等任务上远超GPT-4,显著提升了医学领域的AI应用水平,向实现AI医生的目标迈进了一大步。
100 3
|
5月前
|
人工智能 安全 搜索推荐
北大计算机学院再登国际AI顶刊!张铭教授团队揭露医疗AI致命漏洞
【10月更文挑战第16天】北京大学张铭教授团队在国际顶级人工智能期刊上发表重要成果,揭示了医疗AI系统中的致命漏洞——“模型反演”。该漏洞可使攻击者通过特定数据样本误导AI诊断,引发误诊风险。此发现引起广泛关注,强调了医疗AI安全评估的重要性。
99 4
|
10月前
|
机器学习/深度学习 数据采集 人工智能
【专栏】AI在软件测试中的应用,如自动执行测试用例、识别缺陷和优化测试设计
【4月更文挑战第27天】本文探讨了AI在软件测试中的应用,如自动执行测试用例、识别缺陷和优化测试设计。AI辅助工具利用机器学习、自然语言处理和图像识别提高效率,但面临数据质量、模型解释性、维护更新及安全性挑战。未来,AI将更注重用户体验,提升透明度,并在保护隐私的同时,通过联邦学习等技术共享知识。AI在软件测试领域的前景广阔,但需解决现有挑战。
1155 6
|
6月前
RTX3090可跑,360AI团队开源最新视频模型FancyVideo
【9月更文挑战第23天】近年来,人工智能技术的迅猛发展推动了视频生成领域的进步,但在合成动态、连贯且时长较长的视频方面仍面临挑战。为此,360AI团队提出了FancyVideo模型,通过跨帧文本指导实现更为连贯的视频生成。FancyVideo引入了跨帧文本指导模块(CTGM),包含时间信息注入器(TII)、时间相关性优化器(TAR)和时间特征增强器(TFB)三个组件,分别负责注入帧特定信息、优化相关性和增强时间一致性。这些机制使模型能生成具有连贯动作和丰富运动的视频,适用于动画制作和视频编辑等领域。然而,FancyVideo也存在计算复杂度高和细节真实感提升空间等局限。
81 3
|
7月前
|
人工智能 自然语言处理 Java
Spring AI,Spring团队开发的新组件,Java工程师快来一起体验吧
文章介绍了Spring AI,这是Spring团队开发的新组件,旨在为Java开发者提供易于集成的人工智能API,包括机器学习、自然语言处理和图像识别等功能,并通过实际代码示例展示了如何快速集成和使用这些AI技术。
Spring AI,Spring团队开发的新组件,Java工程师快来一起体验吧
|
7月前
|
人工智能 机器人
从炒菜到缝针!斯坦福炒虾团队打造自主AI达芬奇,苦练神指当外科医生
【8月更文挑战第20天】斯坦福大学的研究团队,昵称“斯坦福炒虾团队”,通过模仿学习开发出一款能自主执行外科手术的AI达芬奇。此项目克服了达芬奇系统运动学不一致性的难题,采用相对动作公式,成功训练AI完成组织操作、针头处理及打结等关键手术步骤。这项成果不仅展现了AI在提升手术精度与效率上的巨大潜力,还可能减少对外科手术新数据的需求,但其临床实用性仍需进一步验证。论文已发布于https://arxiv.org/abs/2407.12998。
77 6

热门文章

最新文章