IT之家 2024年12月20日
AI 的“心智理论”难题:Meta ExploreToM 探索突破之路
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

Meta公司联合高校开发ExploreToM框架,旨在提升大语言模型的心智理论(ToM)能力。心智理论是理解他人想法的关键,但现有模型在复杂ToM推理方面存在不足。ExploreToM通过生成多样化、高难度的对抗性数据集,模拟复杂社会情景,挑战模型认知极限。该框架引入非对称信念更新机制,模拟不同角色对同一情况的观点差异。实验结果表明,主流模型在ExploreToM数据集上表现不佳,但经过微调后,在经典ToM基准测试中准确率显著提高,证明了该框架的有效性。

🧠ExploreToM框架旨在评估和训练大语言模型(LLM)的心智理论(ToM)能力,该能力是人类社会智能的基础,使我们能够理解他人的想法、意图和信念。

🎭该框架通过生成多样化、可扩展的对抗性数据集,模拟复杂的社会情景,挑战LLM的认知极限,以揭示LLM在ToM推理中的盲点。利用A*搜索算法和特定领域语言生成高难度的测试数据集。

🔄ExploreToM还引入了非对称信念更新机制,可以模拟不同角色对同一情况持有不同观点的复杂社交互动,这与现有基准测试不同,可以更准确地评估LLM的ToM能力。

📊实验结果显示,GPT-4o和Llama-3.1-70B模型在ExploreToM数据集上的准确率较低,但在使用ExploreToM数据进行微调后,模型在经典ToM基准测试中的准确率显著提高,证明了该框架的有效性。

IT之家 12 月 20 日消息,Meta 公司携手华盛顿大学和卡内基梅隆大学,组建科研团队,合作开发了 ExploreToM 框架,旨在更有效地评估和训练大语言模型(LLM)的心智理论(Theory of Mind,ToM)能力。

心智理论

心智理论(Theory of Mind,ToM)是人类社会智能的基础之一,能让我们能够理解他人的想法、意图和信念。这种认知能力对于有效的沟通和协作至关重要,是复杂社交互动的支柱。

让 AI 也具备 ToM 能力,对于创建能与人类无缝互动的智能体至关重要,只是当前大型语言模型(LLM)在 ToM 方面仍面临巨大挑战。

现有的基准通常缺乏复杂性和多样性,导致高估模型能力。例如,许多基准测试基于简单的预定义场景,无法复制人类用来推断心理状态的复杂推理。

ExploreToM 框架

ExploreToM 通过生成多样化、可扩展的对抗性数据集,为提升 AI 的 ToM 能力奠定了坚实基础。该研究强调了当前模型的局限性,以及高质量训练数据对于弥合这些差距的潜力。

在数据集方面,ExploreToM 利用 A* 搜索算法和特定领域语言生成多样化、高难度的测试数据集,模拟复杂的社会情景,挑战 LLM 的认知极限。

ExploreToM 与现有基准测试不同,通过创建对抗性故事场景,旨在揭示 LLM 在 ToM 推理中的盲点。

此外该框架还引入了非对称信念更新机制,可以模拟不同角色对同一情况持有不同观点的复杂社交互动。

主流模型测试效果

GPT-4o 和 Llama-3.1-70B 模型在 ExploreToM 数据集上的准确率分别只有 9% 和 0%,凸显了现有 LLM 在处理复杂 ToM 推理方面的不足。

在 ExploreToM 数据上进行微调后,模型在经典 ToMi 基准测试中的准确率提高了 27 个百分点,证明了该框架的有效性。

IT之家附上参考地址

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

ExploreToM 心智理论 大语言模型 人工智能 对抗性数据集
相关文章