MIT 科技评论 - 本周热榜 07月28日 01:06
或能变革古罗马铭文研究范式?谷歌开源AI工具Aeneas,辅助历史学家高精度修复、断代及溯源铭文
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

谷歌DeepMind与多所大学的历史学家合作,研发出名为“埃涅阿斯”(Aeneas)的AI工具,旨在解决解读古罗马拉丁文铭文的难题。该工具能够高精度地填补缺失文字,并推断铭文的制作年代和地理来源。Aeneas基于庞大的拉丁文铭文数据集进行深度“语境化”分析,通过“历史指纹”检索最相关的平行文本,显著提升了历史学家的研究效率和准确性。实验结果显示,在Aeneas的辅助下,地理归属准确率提升超150%,文本修复错误率降低近半,年代判断误差也大幅缩小。该工具不仅能加速研究进程,还能让更多人参与到铭文研究中,被誉为“有望带来变革”的创新。

🏛️ **AI赋能古罗马铭文解读与修复**:谷歌DeepMind推出的“埃涅阿斯”(Aeneas)AI工具,通过深度学习和多模态分析,能够帮助历史学家解读、修复和考证饱经风霜的古罗马拉丁文铭文。它能以高准确率填补铭文中模糊或缺失的文字,并推断出铭文的制作年代和地理来源,极大地减轻了研究人员的工作负担。

🌐 **“语境化”分析与“历史指纹”**:Aeneas的核心能力在于其“语境化”分析。它整合了超过17.6万条拉丁文铭文的数据集,并利用基于Transformer架构的神经网络,将铭文及其图片转化为独特的“历史指纹”。这些指纹编码了文本的字面信息、语言模式、句法结构、历史背景和地理来源等深层信息,使其能在海量数据中检索最相关的平行文本。

📈 **显著提升研究效率与准确性**:通过与23位历史学家的合作实验证明,Aeneas显著提升了研究的效率和准确性。在地理归属方面,准确率提升了152%;在文本修复方面,字符错误率降低了45%;年代判断的平均差距也从31.3年缩短至14.1年。学者们普遍认为Aeneas提供了有用的研究起点,并提升了完成任务的信心。

🤝 **AI作为协作者而非替代者**:Aeneas的设计初衷是成为历史学家的强大协作者,而非替代者。它将学者从繁重、重复的资料搜寻工作中解放出来,使他们能更专注于批判性思考和历史解释。该工具还开源了代码和数据集,并建立了互动网站,旨在让更多人能够参与到铭文研究中, democratizing 历史研究。

💡 **案例展示与未来展望**:Aeneas在分析奥古斯都的《神圣奥古斯都事迹录》和美因茨发现的还愿祭坛铭文等案例中,展现了其捕捉历史学辩论和识别微妙历史关联的强大能力。该技术还将应用于古希腊铭文研究,并计划融入中学历史课堂,培养学生的数字素养和史料批判能力。

在博物馆幽暗的灯光下,一块残破的古罗马石碑静静地躺在展柜中。石碑上的拉丁文铭刻着早已逝去的时代信息,但岁月侵蚀和人为破坏让大部分文字变得模糊不清、难以辨认。对于历史学家和考古学家而言,解读这些被称为“历史最初手稿”的铭文,是一项极其重要却又无比艰辛的工作。现在,来自谷歌的 AI 或许能让这项工作变得轻松一些。

谷歌 DeepMind 与多所大学的历史学家合作,于 2025 年 7 月 23 日在《自然》(Nature)上发表了一项最新研究成果,推出了一款名为“埃涅阿斯”(Aeneas)的 AI 工具。这款以古罗马神话中特洛伊英雄命名的程序,旨在帮助研究人员解读、修复和考证那些饱经沧桑的古罗马拉丁文铭文。它不仅能以高准确率填补铭文中缺失的文字,还能推断出铭文的制作年代和地理来源。

图丨相关论文(来源:Nature)

古罗马人留下了海量的铭文,它们被刻在纪念碑、祭坛、墓碑、陶器甚至涂鸦墙上,内容包罗万象,从皇帝的法令、战争的记录,到商人的账本、情人的诗篇,为后世了解罗马世界的政治、经济、文化乃至普通人的日常生活提供了最直接、最鲜活的证据。与史官笔下的“胜利者书写的历史”不同,这些铭文是古罗马社会各阶层人士的真实心声。然而,解读它们的过程却相当困难。

图丨撒丁岛出土的青铜军事证书残片,由图拉真皇帝颁发给战舰水兵,红色文本为 Aeneas 补足(来源:Nature)

这些铭文常常以碎片的形态被发现,或者文字因风化而变得模糊不清,许多关键信息就此丢失。学者们在研究时,需要依靠自身的知识和丰富的经验,在浩如烟海的文献资料库中寻找可供参照的“平行文本”(parallels)——即那些在措辞、句法、格式或出处上相似的其他铭文。通过对比分析,他们才能逐步拼凑出碎片化的信息,推断缺失部分的内容,并将其置于更广阔的历史背景中进行解读。这一过程不仅耗时耗力,而且高度依赖学者的个人专长和所能接触到的图书馆资源,往往会限制研究的广度和深度。

DeepMind 的研究员 Yannis Assael 和诺丁汉大学的历史学家 Thea Sommerschield 博士领导的团队开发的 Aeneas,正是为了解决这一难题。Aeneas 的核心能力并不是单纯的文本匹配,而是深度“语境化”(contextualizing)。其基于一个名为“拉丁文铭文数据集”(LED,Latin Epigraphic Dataset)的数据集训练而成,这是一个庞大的数据库,整合了来自罗马铭文数据库(EDR,Epigraphic Database Roma)、海德堡铭文数据库(EDH,Epigraphic Database Heidelberg)等多个权威来源的数据,包含了超过 17.6 万条拉丁文铭文,总字符数高达 1,600 万个。

基于这个庞大的数据集,Aeneas 采用了一种基于 Transformer 架构的深度神经网络。它不仅仅是分析铭文的文本内容,还能在某些情况下结合铭文的图片进行多模态分析(multimodal analysis)。当研究人员输入一段残缺的铭文文本(甚至可以标记出缺失文本的长度是已知的还是未知的)和图片时,Aeneas 会通过嵌入(embedding)将每一段铭文转换成一个独特的“历史指纹”。这个指纹不仅编码了文本的字面信息,还包含了其背后隐藏的语言模式、句法结构、历史背景和地理来源等深层信息。

随后,Aeneas 会在这个由海量”历史指纹“构成的多维空间中进行检索,找出与目标铭文最相关的平行文本,并按照相关性排序后呈现给研究人员。更重要的是,它还能根据上下文语境,提出填补缺失文字的多种可能性建议,并预测该铭文最有可能的制作年代和发源地(精确到罗马帝国的 62 个行省之一)。

图丨 Aeneas 架构对文本转录的处理过程(来源:Nature)

为了验证 Aeneas 的实际效果,研究团队进行了一项规模空前的“古代历史学家与人工智能”合作研究。他们邀请了 23 位从事铭文研究的专家,从硕士生到资深教授,参与了一场模拟真实研究工作流程的实验。在实验中,历史学家们首先独立完成对一批铭文的修复、断代和溯源工作。随后,他们会获得 Aeneas 提供的平行文本和预测建议,再进行一次同样的工作。

实验结果显示,在 Aeneas 的帮助下,历史学家的工作效率和准确性都得到了显著提升。在地理归属方面,历史学家独立工作的最高准确率(Top-1 accuracy)为 27%,而在结合了 Aeneas 的平行文本和预测后,这一数字飙升至 68.3%,提升了 152%。

在文本修复方面,以字符错误率(Character Error Rate, CER,该数值越低越好)来衡量,历史学家的独立错误率为 39.0%,而在 Aeneas 的辅助下,错误率降至 21.4%。在年代判断上,预测结果与真实年代范围的平均差距也从 31.3 年缩短至 14.1 年,接近 Aeneas 自身的 12.8 年。在 90% 的情况下,学者们认为 Aeneas 提供的平行文本是“有用的研究起点”,他们完成任务的信心也平均提升了 44%。

图丨历史学家在不同程度埃涅阿斯支持下的铭文任务表现(来源:Nature)

一位参与测试的历史学家感叹道:“Aeneas 检索到的平行文本彻底改变了我对(目标)铭文的看法。如果没有它,我可能要花好几天时间才能找到这些材料,而现在只需要 15 分钟。这让我可以把更多时间用于撰写和构建研究问题,而不是在寻找资料上。”

研究团队还用两个代表性案例来展示 Aeneas 的强大能力。其中一个是罗马帝国第一位皇帝奥古斯都的“神圣奥古斯都事迹录”(Res Gestae Divi Augusti)。关于这篇长篇铭文的确切撰写时间,学术界一直存在争论。Aeneas 在分析了全文后,给出了两个可能的年代高峰,一个在公元前 10-1 年,另一个则在公元 10-20 年。这恰好与学术界两种主流假说高度吻合,证明 Aeneas 能够以量化的方式捕捉并呈现复杂的历史学辩论。

(来源:DeepMind)

另一个案例是一座在今天德国美因茨(古罗马时期称为 Mogontiacum)发现的还愿祭坛。Aeneas 在分析这座祭坛的铭文时,其首要推荐的平行文本是另一座在附近发现、年代稍早的祭坛。这两座祭坛共享着非常罕见的文本程式和圣像学特征,考古学家此前已提出后者可能直接影响了前者。Aeneas 在不知道任何考古背景或空间信息的情况下,仅通过文本分析就精准地识别出了这种微妙而关键的历史关联。索默斯切尔德博士形容这些发现是“令人瞠目结舌的时刻”。

当然,Aeneas 并非完美无缺,它也不是要取代历史学家。哈佛大学的古典学教授 Kathleen Coleman 就指出,目前还不完全清楚这个工具在历史学家的长期工作流程中会多大程度上发挥作用,而且它并不能推测文本的“意义”,最终的解释工作仍需人类专家来完成。研究论文本身也坦诚,模型的性能在数据稀疏的地区和时期会有所下降,并且存在因训练数据本身的局限性而产生偏见的风险。

但 Aeneas 的设计初衷也正是成为一个强大的协作者,而非替代者。它将学者从繁重、重复的资料搜寻工作中解放出来,让他们能更专注于批判性思考和历史解释。剑桥大学的著名古典学家 Mary Beard 教授评价说:“它有望带来变革。”牛津大学的古代史教授、论文的合著者 Jonathan Prag 也表示,这个工具让更广泛的人群能够参与到铭文研究中来,因为“如果没有这样的工具,你只能依靠积累海量的个人知识或拥有一个巨大的图书馆。”

Aeneas 的技术建立在其前身 Ithaca 之上,Ithaca 是一个专注于修复古希腊铭文的 AI 模型。现在,Ithaca 也将升级为由 Aeneas 的技术驱动,性能得到全面提升。为了让这项技术能惠及更多人,研究团队已经将 Aeneas 的代码和数据集开源,并建立了一个名为“预测过去”(predictingthepast.com)的互动网站,免费向所有研究人员、学生和教育工作者开放。他们还与比利时根特的教师培训项目合作,开发了一套教学大纲,旨在将 Aeneas 融入中学历史课堂,培养学生的数字素养和史料批判能力。

参考资料:

1.https://deepmind.google/discover/blog/aeneas-transforms-how-historians-connect-the-past/

2.https://www.nature.com/articles/s41586-025-09292-5

3.https://www.technologyreview.com/2025/07/23/1120574/deepmind-ai-aeneas-helps-historians-interpret-latin-inscriptions/

运营/排版:何晨龙

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

AI 历史研究 古罗马铭文 埃涅阿斯 DeepMind
相关文章