人工智能不仅可以帮助我们解决现实生活中的各种问题,协助我们探索更加便利的未来,还可以帮助我们了解过去—— DeepMind 就利用机器学习创造了新工具,来助力考古学家破译古铭文。
事实上,DeepMind 公司所创建的这一助力考古的 AI 模型,不仅可以帮助恢复古希腊铭文中随着岁月推移而受损缺失的文本,还可以帮助推断这些文本的书写时间及书写这些铭文可能的地理位置,且铭文书写的历史时间的推断误差可以达到小于 30 年。
在新闻发布会上,帮助 DeepMind 公司来创建该模型的历史学家,同时也是一位机器学习专家的西娅·萨默西尔德(Thea Sommerschield)告诉媒体,古代铭文有着十分重要的意义,因为它是供后人了解当时的思想、语言和社会的最直接的证据来源,尤其是因为它是由古代人直接自己编写的。
图 | 古希腊历史铭文,(来源:Sepia Times/Universal Images Group via Getty Images)
然而,面对这样宝贵的历史证据,现代人却经常感到鞭长莫及,因为在文献展示的历史真实面貌与当代历史学家之间隔着一道鸿沟,那就是要读懂这些古代语言,也就是需要对这些古代文本的“翻译”。这道鸿沟也很遗憾地导致人类很难充分利用所有现有的历史文献相关数据。
此外,这些经历了岁月风霜雨打的历史铭文经常由于年代久远已经受到了不同程度的损坏,这也进一步增加了修复这些历史文献的挑战性。另一个难点是,由于古代的历史铭文使用的书写工具不像现代的书写工具使用的多是纸张等有机材料,它们通常是刻在石头或金属等无机材料上,使得历史学家无法使用放射性碳测年之类的方法来确定它们的书写时间。
历史学家萨默西尔德说,通常为了解决上面这些困难,研究铭文的历史学家通过在类似的其他铭文中寻找文本或上下文之间的相似之处,来探测铭文的历史年代的。但是,这些并不足够。
而发现潜在信息以及潜在模式规律这一点,正是机器学习擅长的地方,也是 AI 可以帮助历史学家的地方。
图|古希腊铭文往往是零散的,Ithaca 软件可以建议缺少哪些字母(来源:DeepMind)
DeepMind 新发布的使用 AI 来助力考古的软件名为伊萨卡(Ithaca),该软件已经经过了在一个包含大约 78608 条古希腊铭文的数据集上的训练,而且这些铭文中的每一条都标注了元数据,其中描述了由历史学家考察出来的铭文的书写地点和时间。而伊萨卡所做的,就是像所有其他机器学习系统一样,在这些信息中寻找模式和规律,并利用复杂的数学模型来对这些信息进行编码,然后进一步使用这些推测出的信息来对其他铭文的内容、编写地点和年限进行推断。
有关这款 AI 考古模型工具伊萨卡的论文也已经发表在了《自然》杂志上,在这篇论文中,创建该模型的科学家表示,在使用伊萨卡对受损历史铭文进行修复的测试中,发现伊萨卡的准确率是 62%。另外在从古代世界的 84 个地区推断某一历史铭文的具体书写地点方面,伊萨卡的准确率是 71%,而在推断历史铭文的书写时间方面,伊萨卡可以将铭文的书写日期追溯到误差不超过 30 年。
但是萨默西尔德也强调,尽管伊萨卡可以给我们提供十分有帮助的统计数据,但是必须要记住伊萨卡是不能独立于人类专业知识而运作的。以及伊萨卡所能做的,只是为历史学家在基于传统考古方法收集数据的基础上提供一些建议,作为历史学家解读历史文献的许多辅助工具中的一种。也就是说,伊萨卡绝不是一个可以全自动工作的人工智能历史学家。
图 | 伊萨卡在修复铭文的文本方面的准确率达到 62% 在推断铭文的书写地点方面的准确率为 71% (来源:DeepMind)
除了作为历史学家的辅助工具,伊萨卡的更重要的价值,恐怕还在于它的灵活性。萨默西尔德也强调说,虽然这次发布的伊萨卡只接受过古希腊铭文的训练,但可以很容易地对其进行配置,让它进行其他古代文字的训练,进而可以解读许多不同的古代文献。伊萨卡这一模型的架构赋予了它高度的灵活性,它可以适用于任何古代语言,例如拉丁语、玛雅楔形文字等,而且它也将适用于任何其他书写媒介上的古代文献,例如纸莎草纸、手稿等等。伊萨卡可以探索的,还有很多很多。
-End-
参考:
https://www.theverge.com/2022/3/9/22968773/ai-machine-learning-ancient-inscriptions-texts-deepmind-ithaca-model