本期的 5 篇论文如下:
00:36 TOP1(🔥118) | 🎯 GUI-G$^2$: Gaussian Reward Modeling for GUI Grounding(GUI-G$^2$: 基于高斯奖励模型的GUI定位)
02:14 TOP2(🔥108) | 🧮 MiroMind-M1: An Open-Source Advancement in Mathematical Reasoning via Context-Aware Multi-Stage Policy Optimization(MiroMind-M1:通过上下文感知多阶段策略优化实现数学推理的开源进展)
05:19 TOP3(🔥96) | ♾ Beyond Context Limits: Subconscious Threads for Long-Horizon Reasoning(超越上下文限制:用于长程推理的潜意识线索)
08:51 TOP4(🔥85) | ⚡ $\nabla$NABLA: Neighborhood Adaptive Block-Level Attention(邻域自适应块级注意力)
11:59 TOP5(🔥73) | ⛓ The Invisible Leash: Why RLVR May Not Escape Its Origin(隐形束缚:RLVR为何难以摆脱其起源)

【关注我们】
您还可以在以下平台找到我们,获得播客内容以外更多信息
小红书: AI速递