在古罗马时代,铭文无处不在,从政治涂鸦到爱情诗篇,从商贸记录到纪念碑铭文,这些文字为现代历史学家提供了丰富的生活场景和历史背景。然而,这些铭文往往因破损、褪色或故意损毁而变得难以解读。
缺乏足够的上下文信息,使得对这些文本的恢复、鉴定和年代定位几乎成为不可能的任务。为此,谷歌深度学习团队推出了 “Aeneas” 模型,这是第一个专门为古代铭文提供上下文解读的人工智能工具。
Aeneas 的推出,标志着历史研究中的一次重大进步。传统上,历史学家依赖自身的专业知识和资源来寻找文本之间的相似性,即所谓的 “平行文本”。而 Aeneas 则通过处理数以千计的拉丁铭文,将这一过程大大加速,能在几秒钟内提供相关的文本和上下文平行例证,从而帮助历史学家进行更深入的解读和研究。
该模型不仅限于拉丁文,还可以扩展到其他古代语言、文字和材料,如纸莎草文和货币,进一步丰富了历史研究的可能性。Aeneas 的多模态输入能力,意味着它能够同时处理文本和图像信息,从而提高对铭文的地理来源的判断。这一工具的先进性体现在能够恢复长度不确定的文本缺口,和在对历史文本的恢复和预测方面设立了新的基准。
为了训练 Aeneas,研究团队整合了来自多个历史数据库的数据,包括罗马铭文数据库、海德堡铭文数据库等,创建了一个包含超过176,000条古罗马铭文的拉丁铭文数据集。通过这种方式,Aeneas 能够有效识别并对铭文进行分类,为历史学家的研究提供了强有力的支持。
在一项评估中,23位历史学家参与了使用 Aeneas 进行铭文的恢复、鉴定和年代定位的研究。结果显示,当历史学家结合 Aeneas 提供的上下文信息与模型的预测时,取得了最佳的研究成果。许多参与者表示,Aeneas 加速了他们的工作流程并提高了对复杂铭文任务的信心。
项目:https://deepmind.google/discover/blog/aeneas-transforms-how-historians-connect-the-past/
划重点:
🔍 Aeneas 模型由谷歌 DeepMind 推出,旨在帮助历史学家理解古代文本。
🗣️ 该模型能够分析古代文本的相似性,填补文本空白,减轻历史研究者的负担。
📜 Aeneas 将文本转化为 “历史指纹”,帮助历史学家在更广泛的背景下解读铭文。