HuggingFace 每日AI论文速递 前天 07:07
2025.05.20 | 模型链学习提升效率;AdaptThink优化推理速度。
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

本期AI速递精选了15篇最新的AI论文,涵盖了语言模型、推理模型、注意力机制、多模态学习、联邦学习等多个领域。这些论文探索了如何提升语言模型的学习能力,如何让模型在推理时更有效地利用计算资源,以及如何将AI技术应用于视频扩散、动态场景表示等实际问题。研究方向既有对现有技术的改进与优化,也有对全新方法和框架的探索,反映了当前AI研究的前沿动态。

🔗**模型链学习**:提出了一种用于语言模型的新型学习范式,通过模型链的方式提升学习效果。

🤔**AdaptThink & Thinkless**:这两篇论文都关注推理模型何时以及如何进行思考,旨在提高模型推理的效率和准确性。AdaptThink让模型学习何时思考,而Thinkless则让大语言模型学习何时停止思考。

🚀**Delta注意力机制**:通过Delta校正实现快速而精确的稀疏注意力推断,旨在提高注意力机制的计算效率。

🧮**MM-PRM**:利用可扩展的步骤级监督增强多模态数学推理,提升模型在数学问题上的推理能力。

本期的 15 篇论文如下:

00:23 🔗 Chain-of-Model Learning for Language Model(模型链学习:一种用于语言模型的新型学习范式)

00:58 🤔 AdaptThink: Reasoning Models Can Learn When to Think(AdaptThink:推理模型何时思考的学习)

01:45 🧠 AdaCoT: Pareto-Optimal Adaptive Chain-of-Thought Triggering via Reinforcement Learning(AdaCoT: 通过强化学习实现帕累托最优的自适应思维链触发)

02:21 🚀 Delta Attention: Fast and Accurate Sparse Attention Inference by Delta Correction(Delta注意力机制:通过Delta校正实现快速而精确的稀疏注意力推断)

03:04 🖥 Scaling Computer-Use Grounding via User Interface Decomposition and Synthesis(通过用户界面分解与合成扩展计算机使用中的Grounding)

03:43 🤔 Thinkless: LLM Learns When to Think(智思:大语言模型学习何时思考)

04:23 💡 Seek in the Dark: Reasoning via Test-Time Instance-Level Policy Gradient in Latent Space(暗中求索:在隐空间中通过测试时实例级策略梯度进行推理)

05:00 🧮 MM-PRM: Enhancing Multimodal Mathematical Reasoning with Scalable Step-Level Supervision(MM-PRM:利用可扩展的步骤级监督增强多模态数学推理)

05:39 ✨ Hybrid 3D-4D Gaussian Splatting for Fast Dynamic Scene Representation(混合3D-4D高斯溅射:用于快速动态场景表示)

06:15 🛡 FedSVD: Adaptive Orthogonalization for Private Federated Learning with LoRA(FedSVD:基于LoRA的自适应正交化差分隐私联邦学习)

07:00 🧩 Model Merging in Pre-training of Large Language Models(大型语言模型预训练中的模型合并)

07:53 🤖 CPGD: Toward Stable Rule-based Reinforcement Learning for Language Models(CPGD:面向语言模型稳定规则强化学习)

08:36 🎬 Faster Video Diffusion with Trainable Sparse Attention(基于可训练稀疏注意力的快速视频扩散)

09:23 🧠 Fractured Chain-of-Thought Reasoning(碎裂的思维链推理)

10:03 🧠 Neuro-Symbolic Query Compiler(神经符号查询编译器)

【关注我们】

您还可以在以下平台找到我们,获得播客内容以外更多信息

小红书: AI速递

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

语言模型 推理模型 注意力机制 多模态学习 联邦学习
相关文章