“很多人认为,侦查是一门关于连线匹配的学问。其实最困难的部分,是找到需要连接的线索是哪些。”
——William Wong,伦敦密德萨斯大学
神探夏洛克可能要和警方说再见了。最近,英国警方开始试验一个叫VALCRI(Visual Analytics for sense-making in Criminal Intelligence Analysis)的计算机程序,它可以在短时间内分析犯罪数据,从而帮助警方破获案件,可能比夏洛克还厉害。
△ 英剧《神探夏洛克》海报
VALCRI的主要任务是帮助警察生成合理的场景,也就是何时何地何人何动机在进行犯罪行为。它可以通过扫描数百万的刑事档案记录、笔录资料、图像、视频等资源来确认这些信息是否与案件本身相关。这些结果将呈现在两个大型触摸屏上,与犯罪分析师进行交互。
一个关于逻辑思维游戏
“VALCRI能定位残留在几个犯罪现场的弹壳——分析师判断弹壳和案件本身有没有关系,VALCRI再根据分析师的判断调整结果”,密德萨斯大学的Neesha Kodagoda这样评价道。
△ VALCRI Logo
正由于应用了机器学习,系统在与分析师交互的基础上提高了搜索性能。分析师可以通过调节不同标准的权重改变标准的重要性,从而让VALCRI做出最合适的判断。
一般来说,分析师在处理未知案件的第一步就是搜寻警察数据库的相关事件。通过搜集嫌疑人的作案时间、地点、手法来判断案件本身与嫌疑人的关联性。,Kodagoda还说,“一位经验丰富的分析师需要73人协助才能收集到所有信息,而VALCRI仅仅通过一次单击就能完成”。
可以产生联想
虽然警察记录的信息量大且繁冗,但算法会驱动系统在基础认知水平上理解问题。
在不同的犯罪现场的不同目击者可能用不同的词汇描述一个衣着不整的人。可能会用“褴褛”,可能是“乱蓬蓬”,也可能是“凌乱”。人类在听到这些词语时会正常的联想到他们可能描述的是同一人,而VALCRI也可以做出这样的联想。这个系统甚至也可以利用面部识别软件在监控或图片中识别人脸。
最近,英国西米德兰兹警察局正在用三年的匿名数据(总计达650万条数据)训练VALCRI。比利时的安特卫普警察也在进行测试。
施行困难重重
下个阶段的任务是让VALCRI在犯罪发生时的非匿名数据下运行。警察在调查期间使用的技术可能会在法庭上遭到质疑,所以过早或不正确的部署VALCRI可能会导致案件难以审判。当然,各国之间允许警察获取的数据也有所不同。
另一个施行难点是,很多人难以接受计算机预测犯罪概率并叙述犯罪情况。VALCRI的团队成员Ifan Shepherd表示,“如果犯罪案件中的数据不清晰,那么VALCRI的分析情况也不容乐观。人类分析师总要在案件中做最后把关”。
可能引入偏见
乔治亚理工大学的Mark Riedl表示:“机器学习可以帮助警察,但也会引入一些新的偏见”。系统确实会确定所有的相关特征,同时也必定错过了一些信息。
VALCRI试图通过将过程透明化解决这个问题。如果每个决定都可以被溯源,那么正确结果永远不会被隐瞒。
写到这里几乎可以确定,VALCRI比夏洛克还厉害了。【完】