AI & Big Data 07月24日 16:04
Google DeepMind發表可用來分析古代拉丁銘文的AI模型Aeneas
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

Google DeepMind近期推出了名为Aeneas的AI模型,旨在帮助历史学家更有效地解读、归属和修复残缺的古罗马时代拉丁铭文。Aeneas是一个多模态生成神经网络,能够处理文本和图像输入,并通过分析铭文内容、预测年代、判断地理来源等功能,为学者提供参考。该模型基于庞大的拉丁铭文数据集进行训练,在修复残缺文字方面表现出色,其Top-20准确率高达73%。Aeneas的发布不仅提升了历史研究的效率,也标志着AI在人文领域的应用迈出了重要一步。

🏛️ Aeneas是Google DeepMind开发的首个具备“古代铭文脉络化”能力的AI模型,专门用于分析罗马时代的拉丁铭文,能够帮助历史学家更高效地解读、归属和修复残缺的文本。

🖼️ Aeneas模型是多模态的,支持文本和图像输入,它能够读取铭文文字,利用Transformer技术分析内容,并尝试补全缺字,预测铭文的年代,同时参考铭文照片来判断其地理来源。

📚 该模型基于一个包含17.6万则拉丁文铭文的“拉丁铭文数据集”(LED)进行训练,该数据集整合了多个重要的铭文数据库,为AI提供了丰富的学习材料。

💡 Aeneas在修复残缺文字方面表现出色,能够修复最多10个字符的缺文,其Top-20准确率高达73%,即使在缺文长度未知的情况下,准确率也仍有58%。

🌐 用户可以通过Predicting the Past网站使用Aeneas模型,该网站还整合了分析古希腊铭文的模型Ithaca。同时,Google DeepMind已通过GitHub同步发布了Aeneas的源代码及数据集,方便研究者使用和进一步开发。

Google DeepMind周三(7/23)發表了可用於分析羅馬時代拉丁銘文的AI模型Aeneas,並透過Predicting the Past網站開放使用;該網站同時也整合了先前推出、用於分析古希臘銘文的模型Ithaca。

在西元前6世紀至西元5世紀的古羅馬時代,人們通常將文字(拉丁文)寫在羊皮紙、莎草紙、蠟板、石頭或金屬上。其中,只有刻在石頭與金屬上的銘文較易保存至今。為了協助歷史學家更有效地解讀、歸屬並修復這些殘缺的文本,Google DeepMind開發出Aeneas——號稱是首個具備「古代銘文脈絡化」能力的AI模型

Aeneas是一個多模態生成神經網路,支援文本與圖像輸入。Google DeepMind團隊首先策畫了一套資料集,整合了羅馬銘文資料庫(Epigraphic Database Roma,EDR)、海德堡銘文資料庫(Epigraphic Database Heidelberg,EDH),以及Clauss-Slaby銘文資料庫(Epigraphic Database Clauss Slaby,EDCS-ELT)。團隊將這些經過清理與統整的紀錄,彙編為一個可供機器操作的資料集,名為拉丁銘文資料集(Latin Epigraphic Dataset,LED),內容涵蓋來自古羅馬世界的17.6萬則拉丁文銘文。

Aeneas模型會先讀取銘文的文字,並利用Transformer技術分析內容;如果銘文有缺字,模型會嘗試補上;若不清楚是哪一年寫的,也會預測其年代;而在判斷銘文的地理來源時,則會同時參考銘文的照片。接著,Aeneas會使用嵌入(embedding)技術,將銘文的內容與背景資訊轉換成一組數值,形成其獨特的「歷史指紋」,並據此從拉丁銘文資料集(LED)中找出最相似的銘文,依相似度排序後,提供學者作為參考依據。

Google DeepMind團隊表示,Aeneas不僅能修復最多10個字元的缺文,其Top-20準確率高達73%,即使缺文長度未知,準確率也仍有58%。使用者除了可透過網頁版與之互動外,也已透過GitHub同步釋出原始碼及資料集。

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

Aeneas Google DeepMind AI 拉丁铭文 历史研究
相关文章