HuggingFace 每日AI论文速递 前天 07:02
2025.05.22 | Web导航效率提升;量化误差优化。
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

本期播客聚焦于15篇关于大型语言模型(LLM)的最新研究论文,涵盖Web代理、量化感知训练、视觉定位、多模态模型、扩散模型、高效Agent训练、自适应推理、视频扩散模型、文本到图像生成、知识图谱推理、游戏、三维重建、缓存优化和模型安全等多个前沿领域。这些研究展示了LLM在技术上的持续演进,以及在实际应用中的潜力。

🤖 Web-Shepherd项目旨在增强Web代理,通过PRM(概率关系模型)来提升其性能,使其在网络环境中更智能地执行任务。

🧮 量化感知训练的缩放法则研究,探讨了在训练过程中进行量化时,模型性能随参数量变化的规律,这对于优化模型压缩和部署至关重要。

💡 研究探讨了如何改进LLM的推理能力,如“何时继续思考:用于高效推理的自适应思考模式切换”,这有助于提高模型的效率和准确性。

🖼️ IA-T2I项目专注于互联网增强的文本到图像生成,利用互联网上的信息来提升图像生成质量,使生成的图像更具真实感和细节。

本期的 15 篇论文如下:

00:25 🤖 Web-Shepherd: Advancing PRMs for Reinforcing Web Agents(Web-Shepherd:用于增强Web代理的PRM的进步)

01:13 🧮 Scaling Law for Quantization-Aware Training(量化感知训练的缩放法则)

01:53 🤖 UniVG-R1: Reasoning Guided Universal Visual Grounding with Reinforcement Learning(基于强化学习和推理引导的通用视觉定位)

02:28 🎨 MMaDA: Multimodal Large Diffusion Language Models(MMaDA:多模态大型扩散语言模型)

03:04 🔄 Diffusion vs. Autoregressive Language Models: A Text Embedding Perspective(扩散模型 vs. 自回归语言模型:文本嵌入的视角)

03:44 💻 Efficient Agent Training for Computer Use(用于计算机使用的高效Agent训练)

04:26 🧠 Learn to Reason Efficiently with Adaptive Length-based Reward Shaping(基于自适应长度奖励塑造的高效推理学习)

05:08 💡 When to Continue Thinking: Adaptive Thinking Mode Switching for Efficient Reasoning(何时继续思考:用于高效推理的自适应思考模式切换)

05:39 🤖 Vid2World: Crafting Video Diffusion Models to Interactive World Models(Vid2World:构建交互式世界模型的视频扩散模型)

06:16 🖼 IA-T2I: Internet-Augmented Text-to-Image Generation(互联网增强的文本到图像生成)

06:49 🧠 Deliberation on Priors: Trustworthy Reasoning of Large Language Models on Knowledge Graphs(基于先验知识的审慎:大型语言模型在知识图谱上的可信推理)

07:31 🎮 lmgame-Bench: How Good are LLMs at Playing Games?(lmgame-Bench:大型语言模型在玩游戏方面表现如何?)

08:18 🏙 Constructing a 3D Town from a Single Image(从单张图像构建三维城镇)

08:58 🚀 dKV-Cache: The Cache for Diffusion Language Models(dKV-Cache:扩散语言模型的缓存)

09:40 🛡 How Should We Enhance the Safety of Large Reasoning Models: An Empirical Study(我们应该如何提升大型推理模型的安全性:一项实证研究)

【关注我们】

您还可以在以下平台找到我们,获得播客内容以外更多信息

小红书: AI速递

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

大型语言模型 LLM 人工智能 研究
相关文章