厦门大学团队正在利用人工智能多模态大模型,结合甲骨文的音、形、义等信息,辅助专家进行甲骨文考释工作。甲骨文作为世界四大古文字之一,其考释工作传统上依赖专家的人工释读,耗时费力。AI技术的快速发展为甲骨文考释提供了新的途径,团队构建了更大规模、更高质量的甲骨文多模态数据集,并提出了基于多模态大模型的考释模型。该模型将融合音、形、义、用等多元信息,设计跨字体图像映射、IDS解码等任务,利用AI强大的跨模态理解能力,辅助专家进行更快速、高效的甲骨文考释,并开发一种轻量级的考释系统,以适应实际考释场景。
🤔**甲骨文考释的传统方法:** 传统甲骨文考释工作主要依靠专家的人工释读,通过字形分析、辞例研究等方法,需要专家具备深厚的知识积累和大量的文献阅读基础,效率低下且难以满足日益增长的考释需求。
💡**AI技术在甲骨文考释中的应用:** 厦门大学团队尝试利用人工智能多模态大模型,结合甲骨文的音、形、义等多元信息,辅助专家进行更高效的考释工作。AI强大的语义表示能力和跨模态理解能力为甲骨文考释提供了新的思路和方法。
📚**甲骨文多模态数据集的构建:** 针对甲骨文数据稀缺、图像质量参差不齐等问题,团队系统整理相关古文字数据,构建了更大规模、更高质量的甲骨文多模态数据集,为AI模型的训练提供了充足的数据基础。
🚀**多元信息融合的考释模型:** 项目将设计融合音、形、义、用多元信息的端到端甲骨文综合考释模型,综合利用字形结构、语义关联、同音通假和用法聚类分析,开发一种更加轻量的考释系统,以适应资源有限的实际考释场景。
🎯**跨字体图像映射和IDS解码等任务设计:** 项目将设计一系列与实际考释过程密切相关的任务和评估方法,如跨字体图像映射、跨字体IDS解码和甲骨字现代字对译关系等,以有效训练多模态大模型,提升模型的考释能力。
IT之家 12 月 5 日消息,厦门大学官方公众号昨日(12 月 4 日)发布博文,宣布该校团队正尝试利用人工智能(AI)多模态大模型,结合甲骨文的音、形、义等多元信息,辅助专家进行更高效的甲骨文考释工作。
甲骨文简介
IT之家援引博文介绍,甲骨文也被称作“殷墟文字”,距今已有三千多年历史,是世界四大古文字之一,是现代汉字的根脉。

传统的甲骨文字考释工作极其耗时费力,依托于专家进行人工释读,多采用字形分析、辞例研究等方法,需要考古专家以深厚的知识积累和大量的文献阅读为基础,结合多方面的知识去破译甲骨字,已经难以为继。
借助 AI 破译甲骨文
近年来 AI 技术迅猛发展,利用深度学习模型超强语义表示能力来实现甲骨文的辅助考释,优势已经崭露头角。
团队研究人员针对甲骨文数据稀缺、图像质量参差不齐的现状,系统整理相关古文字数据,构建更大规模、更高质量的甲骨文多模态数据集,提出了“基于甲骨文多模态大模型的多元信息辅助考释模型”的技术方案。
项目将设计一系列与实际考释过程密切相关的任务和评估方法,如跨字体图像映射、跨字体 IDS(表达结构的部首偏旁序列)解码和甲骨字现代字对译关系等,以有效训练多模态大模型。

团队利用其强大的跨模态理解能力,辅助甲骨文考释。在大模型提供的语义嵌入基础上,本项目还将设计融合音、形、义、用多元信息的端到端甲骨文综合考释模型,综合利用字形结构、语义关联、同音通假和用法聚类分析,开发一种更加轻量的考释系统,以适应资源有限的实际考释场景。