您当前位置:主页 > G生活画 >当Google鬼才遇上哈佛精英!GoogleNgram带你一 >
当Google鬼才遇上哈佛精英!GoogleNgram带你一
G生活画

当Google鬼才遇上哈佛精英!GoogleNgram带你一

粉丝数:183+
浏览量:9287欢迎浏览本网站的精品文章
时间:2020-07-08 22:52:44
当Google鬼才遇上哈佛精英!GoogleNgram带你一

人类从诞生那一刻起就在学习各种知识,并在阅历无数后迎接生命的尽头,这几十年的时间,要怎幺把人类存在二十万年所累积的智慧装进脑袋里呢?快试试从 Google Ngram 读历史吧!

把印刷术数位化!
当Google鬼才遇上哈佛精英!GoogleNgram带你一

从发明印刷术到现在,共有一千五百万本以上的书被发行,若真要吸收从古至今的智慧和知识,土法炼钢地把这一千多万本书全都读过一遍是最直接的想法,但同时也是既费时又没效率的不可能任务,究竟要怎幺省时又方便的获得历史知识呢?

就读哈佛大学的 Jean-Baptiste Michel 和 Erez Lieberman Aiden 想到可以藉由把书籍数位化来增加阅读效率,但如此一来就得面临数百万场与原着作者的官司纠纷,几经讨论后,他们决定从中挑选出五百万本书,统计特定词彙在 1800 年至 2000 年内所有出版书籍中所出现的次数,并藉此整理历史数据的变化。这个由字量统计出的曲线图不仅加快了资讯分析的效率,更产生了让他们惊喜万分的效果!

用关键字见证历史
当Google鬼才遇上哈佛精英!GoogleNgram带你一

只要输入各行各业的职位名称,就可以得知何种职位最常被热烈讨论及关注。一般而言,一个人的知名度会随着时间增加,因此,若你想在年轻时成名,就应该去当位演员,因为你的人气会从二十岁开始快速累积;如果你能耐心等待成名的漫长过程,就去当位作家,但若你想获得最高、最久的知名度,就去当位政治人物吧,你将在 50 岁后获得高知名度,去世后名气还是会继续上升。令人不胜唏嘘的是,从图表来看,千万不要当数学家,因为不论年轻或上了年纪、有伟大成就或毫无贡献,都没有人会有兴趣讨论你。

当Google鬼才遇上哈佛精英!GoogleNgram带你一

除此之外,还可以从图表中看出历史的痕迹。按常理来说,知名艺术家的名气会随着时间增加而讨论度提高,但在德国的数据里,超现实主义画家 Marc Chagall 在 1933 年至 1945 年的出现率明显骤降,之后却又再度飙升,数据出现低谷的原因其实有迹可循,这 12 年的德国正经历恐怖纳粹的高压统治,严峻的书籍审查制度阻隔了身为犹太人的 Marc Chagall 的作品,而这个制度直到二次大战结束后才废除,德国人民才得以接触珍贵的超现实画作。藉由书籍中的关键字,每一张图表都无声地向人们诉说真实存在的历史。

书本里的台湾

任职于 Google 的 Jon Orwant、Matt Gray 和 Will Brockman 见识到庞大规模的数据其实是研究人类文化的重要力量,因此利用保存在电子资料库的一千五百万本书及其他相关资料,建立了相似的分析工具──Ngram。

用来建构系统的资料除了书籍、手稿、报纸等书面讯息之外,也有非文字的资料,如艺术品和画作等,这些被留下来的一字一句,都成为验证历史轨迹的精彩纪录。

当Google鬼才遇上哈佛精英!GoogleNgram带你一

若你在 Ngram 输入”Taiwan”,将可以看到台湾从 1800 年至 2008 年在英文书籍中出现的次数。在二次大战结束后,台湾被讨论的程度逐渐升高,自 1960 年代的经济奇蹟,一直到 1980 年代被誉为「亚洲四小龙」,都有更多的书籍在讨论着我们,但 1990 年代末期开始,曲线却开始走下坡,这样的消息一则以喜,代表台湾并未发生太严重的恶事,不像深陷金融困境的欧猪五国,困顿的经济情况被许多经济学家撰写成书,成为他国国家发展的借镜;但同时也一则以忧,因为台湾并未出现能震撼国际的高度经济发展或优良社会规划,以至于大部分英文书籍和资料都较少提及台湾。

Jean-Baptiste Michel 和 Erez Lieberman Aiden 提醒大家,这样的图表确实能推测出许多事件的历史背景,却有更多细节需要深入验证。虽然不能单用一张图表就断定某件事情的因果始末,却可以从中反思历史对于过去及未来的影响。看完关于台湾的数据分析,不如花些时间,好好思考你希望「Taiwan」这条线在下一个 200 年会如何变化吧!

相关推荐