眼中的历史用人工智能挖掘旧报纸里的英力量
2021-09-02 19:31 来源:桐乡养生网
AI眼中的历史:用人工智能挖掘旧报纸里的英国现代史
华军软件园注:本文作者Martha Henriques,由Sophie、刘晓莉编译。文章由大数据文摘授权华军软家园发布。
试问,哪位历史学家有时间阅读跨越一个多世纪英国历史的数千万份报纸?没人可以。所以,计算机科学家和历史学家一起,教会了计算机做这件事——分析报道中的数十亿个词,让我们重新认识19世纪到20世纪初的英国历史。
这项研究发表在PNAS上,是对“文化组学”这一新兴学科的实践。
注:文化组学culturomics,指通过数字化文本的定量分析研究人类行为和文化趋势的计算词汇学
计算机分析了1800年至1950年间的3500万份英国地区报道中的286亿词汇,约占该时期英国地区报刊总量的14%。
作为对比,一个成年人的平均阅读速度为大约每分钟300字。按照这个速度,一个人需要整整180年来完成所有的阅读。如果算上人类的休息时间,阅读需要的时间就更长了。而计算机算法用大约8周完成了所有的工作,该项目研究员英国布里斯托大学计算机科学家Nello Cristianini称。
这项研究的第一步是人工检查,以确保计算机可以从报纸中提取真实的历史事件。检查的内容为计算机是否能准确地找到诸如加冕,已知的疾病流行和战争等事件。
有趣的部分发生在下一步:研究计算机算法是否可以找到历史学家使用传统方法不能找到的历史事件。
“我们正在寻找一些不太明显的历史进程——例如,技术的兴起,”Cristianini说。“我们看到1900年左右,技术发生了变化。我们还能进一步解读更微妙的信号:我们可以看到电报,和广播被公众接受的速度有多快。这个速度在不断加快。现在,人们接受Twitter或Facebook只需要一年。”
人工智能分析不仅仅是简单的字数统计(这是曾经大量数字化文学研究的做法)。这一次,研究人员使用AI技术,如自然语言处理,以获得对上下文和文本含义的理解。你可以认为它是终极的快速阅读。
他们发现了什么?这是AI眼中的英国历史:
1、电力什么时候赶超了蒸汽?
1898年。这一年,电在中出现的频率开始超过蒸汽,电能逐渐取代了蒸汽。
图:20世纪来临时,电力取代了蒸汽(来源Nello Cristianini / PNAS)
2、火车什么时候赶超了马车?
仅仅四年后的1902年。火车的时代开始于19世纪40年代,那时英国开始发展国家铁路系统。但就方面而言,火车在半个多世纪后才变得比马车更重要。
图:“铁马”(来源New York Public Library / Flickr)
3、人们什么时候开始不再讨论奴隶制?
对奴隶制的报道高峰出现于年废奴运动时期和年美国南北战争期间。1870年后,报纸几乎不再提及奴隶制。
图:1830年到1870年,奴隶制出现在中(来源Nello Cristianini / PNAS)
4、什么时候开始报道妇女参政权运动?
1906年。一个戏剧性的报道高峰出现在1913年,在女性参政倡议者Emily Wilding Davison试图在赛马会上阻拦英国国王的马之后。
图:Emily Davison倒在英国国王的马前,四天后她死于头部创伤(来源Hulton Archive)
5、女性什么时候得到了和男性相同数量的报道?
从来没有过。20世纪开始,对女性的报道率有上升趋势,且在二战时期突然增加。但在整个分析覆盖的时期,中每提到一个女性大约会提到三个男性。在21世纪,这个数字更接近男女比2:1,但这种转变并不大。
图:战争时期,女性得到了更多的报道(来源Wikime)
6、勇气什么时候最重要?
毫不意外,在第一次和第二次世界大战期间勇气被提到最多。维多利亚时代的价值观,例如毅力,在整个分析覆盖时期表现出报道频率的稳步下降。但在战争年代,对耐力和勇气等价值观的报道出现了明显的增加。
7、英国和英国人的概念(Britishness)是何时出现的?
注:英国全称为大不列颠及北爱尔兰联合王国United Kingdom of Great Britain and Northern Ireland。不列颠Britain/British是对英国和英国人的统称,相较于对英国某部分的特指例如England/English是指英格兰和英格兰人,或Scotland/Scottish是指苏格兰和苏格兰人。
对“不列颠”的报道出现于20世纪早期,1900年左右出现第一个峰值,一战和二战期间出现了两个更大的峰值。这个发现和很多历史学家的观点不同——很多历史学家认为“不列颠”在更早前就已经是一个活跃的概念了。
图:“不列颠”的概念在20世纪早期开始活跃,而传统上,历史学家认为“不列颠”出现得更早
凡特的研究团队计划:现阶段先合成出有生命存在的最小量基因 (来源Nello Cristianini / PNAS)
8、经济什么时候成为了口号?
与“经济”相比,“政治经济”一直是更为常用的术语,直到1900年左右,这两个词的用法变得更加模糊。20世纪初,这两个术语在约十年间的使用频率大致相似,之后,“经济”开始成为更受欢迎的用语,在几个剧烈的峰值后使用频率开始稳步上升。
图:“政治经济”的使用被“经济”取代(来源Nello Cristianini / PNAS)
原文链接:
重庆治白癜风哪家医院好成都治癫痫专业医院
江中黄芪生脉饮适用哪类人
- 上一篇:法官一键揭开套路贷虚假诉讼外衣权衡
- 下一篇:算命是什么套路算命套路揭秘永恒
-
夏天养狗狗一定要注意这一点别让你的不细心位置
各位养狗狗的主人应该都知道狗狗和人类是不一样的,它们是没有汗腺来散热的,为了自己的爱犬的健康,在每年夏天的高温时期,建议还是多多注意一下,避免自己的狗狗因为高温出现健康问题,甚至生命危险,...
-
处理吉娃娃的三种意外窒息休克晕车位置
我们在饲养吉娃娃的过程中,也不能保证它们一直都是健健康康的,有时候在我们不注意的时候,就会发生一些意外去影响它们的健康,比如说窒息和休克,如果宠物狗在我们不注意的时候吃了什么东西造成梗塞,...
-
墨西哥红膝头价格适应湿度的能力较高位置
墨西哥红膝头价格,墨西哥红膝头的市场价格在300元左右,它们的性格是比较温顺的,正常情况是不会去攻击人类的,除非是人类把它们惹毛了有可能会咬人。那应该怎么饲养墨西哥红膝头呢?它们有些生活习性呢...
-
墨西哥无毛犬幼犬怎样护理注意保温位置
墨西哥无毛犬幼犬怎样护理,墨西哥无毛犬是一种很特别的宠物犬,长相非常的奇特,全身无毛。由于墨西哥无毛犬长相比较丑陋,因此目前饲养该犬的家庭还是比较少的,那应该怎么做好墨西哥无毛犬幼犬的护理...
-
埃及神话中的猫猫是贝斯特女神的化身位置
埃及神话中的猫,究竟是什么样的?埃及人喜欢猫似乎是一件公开的事情,在许多埃及图像中,在法老的身边,我们总是能够找到猫咪的身影。那么,埃及人为什么这么喜欢猫咪呢?这或许和埃及神话有着千丝万缕的...
-
埃及神仙鱼吃什么属于杂食性的鱼类位置
埃及神仙鱼吃什么,埃及神仙鱼是一种比较好饲养的观赏鱼,该鱼属于杂食性的观赏鱼,它们对食物的要求并不是很高,一般的人工饵料都能接受。埃及神仙鱼特别喜欢吃活饵生饵,但是为了能让食物营养更全面,...