AI 论文周报丨微软/清华/香港大学等最新成果，一键解锁通用智能体/地理信息系统/机器人操作……领域新突破

雾纪 2025-08-16 15:40 浙江

在通用智能体领域，AI 正从单一任务执行迈向具备推理、多模态交互与自主学习的综合能力，但现有强化学习训练方法常与代理执行机制紧密耦合、迁移困难，且对系统侵入性高。

Agent Lightning 框架应运而生，实现了训练与执行的完全解耦，几乎无需改动代码即可集成多种 Agent 架构，并通过统一接口与轨迹分解，将复杂交互转化为可训练数据，支持多场景下的灵活 RL 微调。

论文链接：https://go.hyper.ai/se37P

为了让更多用户了解学术界在人工智能领域的最新动态，HyperAI超神经官网（hyper.ai）现已上线「最新论文」板块，每天都会更新 AI 前沿研究论文。以下是我们为大家推荐的 5 篇热门 AI 论文，同时我们还为大家总结了论文架构的思维导图，一起来速览本周 AI 前沿成果吧 ⬇️

本周论文推荐

Agent Lightning: Train ANY

AI Agents with Reinforcement

Learning

本文提出了一个灵活且可扩展的框架 Agent Lightning，可对任意 AI Agent 进行基于强化学习的大语言模型训练。与现有方法将 RL 训练与 Agent 紧密耦合，或依赖带掩码的序列拼接不同，Agent Lightning 实现了 Agent 执行与训练的完全解耦，能够无缝对接通过多种方式开发的现有 Agent，几乎无需修改任何代码。

论文链接：https://go.hyper.ai/se37P

模型架构图

论文思维导图

AlphaEarth Foundations: An

embedding field model for

accurate and efficient global

mapping from sparse label data

本文介绍了一种名为 AlphaEarth Foundations 的地球观测数据处理模型，旨在从稀疏标注的数据中高效准确地生成全球地图和监测系统。该模型通过学习不同来源的空间、时间及测量数据之间的关系，生成一个通用的地理空间表示，从而在不重新训练的情况下，在一系列的地图评估任务中表现优于所有先前的特征化方法。

论文链接：https://go.hyper.ai/HSPlS

Satellite Embedding 地球观测数据集：https://go.hyper.ai/WTpjt

模型架构图

论文思维导图

Cognitive Kernel-Pro: A Framework

for Deep Research Agents and

Agent Foundation Models Training

本文提出了 Cognitive Kernel-Pro，一个完全开源且在最大程度上免费的多模块智能代理框架，旨在推动先进人工智能代理的开发与评估的民主化。实验结果表明，Cognitive Kernel-Pro 在开源且免费的代理系统中达到当前最优水平，并超越此前领先的系统如 WebDancer 和 WebSailor，为可获取、高性能的人工智能代理树立了新的性能标杆。

论文链接：https://go.hyper.ai/HIS8M

CognitiveKernel-Pro-Query 文本生成基准数据集：https://go.hyper.ai/ofF3N

模型框架图

论文思维导图

Simulating Human-Like

Learning Dynamics with

LLM-Empowered Agents

本文提出了 LearnerAgent，一个基于大语言模型的新型多 Agent 框架，旨在模拟逼真的教学环境。为探索类人学习动态，研究团队构建了具有心理学依据的学习者画像，并设立无画像的通用学习者以检验基础 LLM 的默认行为。通过模拟「每周知识获取」「每月策略选择」「阶段性测试」与「同伴互动」，研究团队能够跟踪学习者为期一年的动态学习历程。

论文链接：https://go.hyper.ai/GbGs2