2025.05.22 | Web导航效率提升；量化误差优化。

本期的 15 篇论文如下：

00:25 🤖 Web-Shepherd: Advancing PRMs for Reinforcing Web Agents（Web-Shepherd：用于增强Web代理的PRM的进步）

01:13 🧮 Scaling Law for Quantization-Aware Training（量化感知训练的缩放法则）

01:53 🤖 UniVG-R1: Reasoning Guided Universal Visual Grounding with Reinforcement Learning（基于强化学习和推理引导的通用视觉定位）

02:28 🎨 MMaDA: Multimodal Large Diffusion Language Models（MMaDA：多模态大型扩散语言模型）

03:04 🔄 Diffusion vs. Autoregressive Language Models: A Text Embedding Perspective（扩散模型 vs. 自回归语言模型：文本嵌入的视角）

03:44 💻 Efficient Agent Training for Computer Use（用于计算机使用的高效Agent训练）

04:26 🧠 Learn to Reason Efficiently with Adaptive Length-based Reward Shaping（基于自适应长度奖励塑造的高效推理学习）

05:08 💡 When to Continue Thinking: Adaptive Thinking Mode Switching for Efficient Reasoning（何时继续思考：用于高效推理的自适应思考模式切换）

05:39 🤖 Vid2World: Crafting Video Diffusion Models to Interactive World Models（Vid2World：构建交互式世界模型的视频扩散模型）

06:16 🖼 IA-T2I: Internet-Augmented Text-to-Image Generation（互联网增强的文本到图像生成）

06:49 🧠 Deliberation on Priors: Trustworthy Reasoning of Large Language Models on Knowledge Graphs（基于先验知识的审慎：大型语言模型在知识图谱上的可信推理）

07:31 🎮 lmgame-Bench: How Good are LLMs at Playing Games?（lmgame-Bench：大型语言模型在玩游戏方面表现如何？）

08:18 🏙 Constructing a 3D Town from a Single Image（从单张图像构建三维城镇）

08:58 🚀 dKV-Cache: The Cache for Diffusion Language Models（dKV-Cache：扩散语言模型的缓存）

09:40 🛡 How Should We Enhance the Safety of Large Reasoning Models: An Empirical Study（我们应该如何提升大型推理模型的安全性：一项实证研究）

【关注我们】

您还可以在以下平台找到我们，获得播客内容以外更多信息

小红书: AI速递

Fish AI Reader