AI眼中的历史:用人工智能挖掘旧报纸里的英国现代史

简介:

试问,哪位历史学家有时间阅读跨越一个多世纪英国历史的数千万份报纸?没人可以。所以,计算机科学家和历史学家一起,教会了计算机做这件事——分析新闻报道中的数十亿个词,让我们重新认识19世纪到20世纪初的英国历史。

这项研究发表在PNAS上,是对“文化组学”这一新兴学科的实践。

注:文化组学culturomics,指通过数字化文本的定量分析研究人类行为和文化趋势的计算词汇学

计算机分析了1800年至1950年间的3500万份英国地区新闻报道中的286亿词汇,约占该时期英国地区报刊总量的14%。

作为对比,一个成年人的平均阅读速度为大约每分钟300字。按照这个速度,一个人需要整整180年来完成所有的阅读。如果算上人类的休息时间,阅读需要的时间就更长了。而计算机算法用大约8周完成了所有的工作,该项目研究员英国布里斯托大学计算机科学家Nello Cristianini称。

这项研究的第一步是人工检查,以确保计算机可以从报纸中提取真实的历史事件。检查的内容为计算机是否能准确地找到诸如加冕,已知的疾病流行和战争等事件。

有趣的部分发生在下一步:研究计算机算法是否可以找到历史学家使用传统方法不能找到的历史事件

“我们正在寻找一些不太明显的历史进程——例如,技术的兴起,”Cristianini说。“我们看到1900年左右,技术发生了变化。我们还能进一步解读更微妙的信号:我们可以看到电报,电话和广播被公众接受的速度有多快。这个速度在不断加快。现在,人们接受Twitter或Facebook只需要一年。”

人工智能分析不仅仅是简单的字数统计(这是曾经大量数字化文学研究的做法)。这一次,研究人员使用AI技术,如自然语言处理,以获得对上下文和文本含义的理解。你可以认为它是终极的快速阅读。

他们发现了什么?这是AI眼中的英国历史:

 1、电力什么时候赶超了蒸汽?

1898年。这一年,电在新闻中出现的频率开始超过蒸汽,电能逐渐取代了蒸汽。

AI眼中的历史:用人工智能挖掘旧报纸里的英国现代史

图:20世纪来临时,电力取代了蒸汽(来源Nello Cristianini / PNAS)

 2、火车什么时候赶超了马车?

 仅仅四年后的1902年。火车的时代开始于19世纪40年代,那时英国开始发展国家铁路系统。但就新闻方面而言,火车在半个多世纪后才变得比马车更重要。

AI眼中的历史:用人工智能挖掘旧报纸里的英国现代史

图:“铁马”(来源New York Public Library / Flickr)

3、人们什么时候开始不再讨论奴隶制?

 对奴隶制的报道高峰出现于1830-1870年废奴运动时期和1861-1865年美国南北战争期间。1870年后,报纸几乎不再提及奴隶制。

AI眼中的历史:用人工智能挖掘旧报纸里的英国现代史

图:1830年到1870年,奴隶制出现在新闻中(来源Nello Cristianini / PNAS)

4、记者什么时候开始报道妇女参政权运动?

1906年。一个戏剧性的报道高峰出现在1913年,在女性参政倡议者Emily Wilding Davison试图在赛马会上阻拦英国国王的马之后。

AI眼中的历史:用人工智能挖掘旧报纸里的英国现代史

图:Emily Davison倒在英国国王的马前,四天后她死于头部创伤(来源Hulton Archive)

5、女性什么时候得到了和男性相同数量的报道?

从来没有过。20世纪开始,对女性的报道率有上升趋势,且在二战时期突然增加。但在整个分析覆盖的时期,新闻中每提到一个女性大约会提到三个男性。在21世纪,这个数字更接近男女比2:1,但这种转变并不大。

AI眼中的历史:用人工智能挖掘旧报纸里的英国现代史

图:战争时期,女性得到了更多的报道(来源Wikime)

6、勇气什么时候最重要?

毫不意外,在第一次和第二次世界大战期间勇气被提到最多。维多利亚时代的价值观,例如毅力,在整个分析覆盖时期表现出报道频率的稳步下降。但在战争年代,对耐力和勇气等价值观的报道出现了明显的增加。

7、英国和英国人的概念(Britishness)是何时出现的?

注:英国全称为大不列颠及北爱尔兰联合王国United Kingdom of Great Britain and Northern Ireland。不列颠Britain/British是对英国和英国人的统称,相较于对英国某部分的特指例如England/English是指英格兰和英格兰人,或Scotland/Scottish是指苏格兰和苏格兰人。

对“不列颠”的报道出现于20世纪早期,1900年左右出现第一个峰值,一战和二战期间出现了两个更大的峰值。这个发现和很多历史学家的观点不同——很多历史学家认为“不列颠”在更早前就已经是一个活跃的概念了。

AI眼中的历史:用人工智能挖掘旧报纸里的英国现代史

图:“不列颠”的概念在20世纪早期开始活跃,而传统上,历史学家认为“不列颠”出现得更早

(来源Nello Cristianini / PNAS)

8、经济什么时候成为了口号?

与“经济”相比,“政治经济”一直是更为常用的术语,直到1900年左右,这两个词的用法变得更加模糊。20世纪初,这两个术语在约十年间的使用频率大致相似,之后,“经济”开始成为更受欢迎的用语,在几个剧烈的峰值后使用频率开始稳步上升。

AI眼中的历史:用人工智能挖掘旧报纸里的英国现代史

图:“政治经济”的使用被“经济”取代(来源Nello Cristianini / PNAS)

原文链接:ibtimes.co.uk

本文作者:大数据文摘

本文转自雷锋网禁止二次转载,原文链接

相关文章
|
1天前
|
人工智能 数据挖掘 机器人
同样是人工智能 客户在哪儿AI和GPT等大模型有什么不同
客户在哪儿AI生产的是企业全历史行为数据,同时还针对ToB企业,提供基于企业全历史行为数据的数据分析服务。
|
6天前
|
人工智能 搜索推荐 数据处理
苹果发布最新人工智能系统——Apple Intelligence,重新定义AI
Apple推出Apple Intelligence,集成于iOS 18等系统中,提供情境感知的个性化服务。新功能包括跨应用操作、屏幕阅读、写作辅助、图像生成及邮件管理。Siri升级,支持语言理解与生成。未来计划扩展多语言支持、集成第三方模型。与OpenAI合作将ChatGPT融入Siri。
16 5
|
5天前
|
机器学习/深度学习 人工智能 算法
人工智能伦理框架:构建AI的道德指南针
【7月更文挑战第16天】随着人工智能技术的快速发展,其对社会的深远影响引起了广泛关注。本文探讨了构建人工智能伦理框架的必要性,并提出了一套基于四大原则的伦理指导方针:透明度、公正性、责任归属和隐私保护。文章旨在为AI系统的设计与部署提供道德指南,确保技术进步与人类价值观相协调。
9 3
|
4天前
|
人工智能 运维 Cloud Native
|
6天前
|
机器学习/深度学习 人工智能 自然语言处理
AI初探:人工智能的定义、历史与未来展望
【7月更文第15天】在科技飞速发展的今天,人工智能(Artificial Intelligence, AI)已经成为推动社会进步的关键力量,渗透到我们生活的方方面面,从智能家居到自动驾驶汽车,从精准医疗到智能金融,无不展现出其深远的影响。本文旨在为读者揭开人工智能的神秘面纱,从基本概念出发,回顾其发展历程,并探索未来的无限可能。
36 2
|
7天前
|
人工智能 搜索推荐 vr&ar
苹果手机iOS18最新升级:植入AI人工智能,国内百度文心一言,国外GPT4o来辅助
iOS 18亮点速览:AI强化的Siri、RCS安卓消息兼容、自定义主屏、辅助功能增强,VR进步,新隐私工具,包括锁定APP和眼动追踪。Passwords app保障安全,Apple Intelligence提升个性化体验。
17 1
|
12天前
|
人工智能 机器人 物联网
「AI人工智能」关于AI的灵魂发问
**AI正重塑世界,区别"AI+"与"+AI":** "AI+"侧重互联网结合各行各业,如医疗、教育,引发行业重组,形成AI驱动的新经济。"+AI"则指传统行业利用AI提升自身,保持行业主导。AI的三维维度涉及与其他技术融合、应用场景结合以及不同产业的智能化进程。
23 3
|
12天前
|
机器学习/深度学习 人工智能 算法
「AI人工智能」什么是AI技术
**AI技术概览** 本文探讨人工智能(AI)的核心,包括知识图谱、问答系统和AI芯片。AI在硅光芯片、个性化推荐等领域展现趋势,前端开发与AI结合,涉及人机交互、数据可视化和模型训练。此外,文章讨论了监督学习的应用、深度学习工程师的市场需求,以及梯度消失等问题,提示了适宜的批量大小对随机梯度下降的影响。
25 0
「AI人工智能」什么是AI技术
|
13天前
|
人工智能
AI Undetect:精心打造的人工智能,编写出无限接近人类质量的文本
【AI Undetect & AI Humanize】工具组合助力保持文本原创性与真实性,避过AI检测。AI Undetect专为绕过检测系统设计,而AI Humanize提供检测与改写功能。检测文本是否由AI生成,或用其快速高质量改写。改写后内容同样可检验证明效果。尝试链接:[AI Humanizer](https://aiundetect.com/)。
AI Undetect:精心打造的人工智能,编写出无限接近人类质量的文本
|
11天前
|
机器学习/深度学习 人工智能 自然语言处理
人工智能|HCIA-AI V3.0(一)——人工智能概览
人工智能|HCIA-AI V3.0(一)——人工智能概览

热门文章

最新文章