2025.07.15 | 数据集支持虚拟人生成；强化学习需防数据污染。

HuggingFace 每日AI论文速递 07月16日 08:02

2025.07.15 | 数据集支持虚拟人生成；强化学习需防数据污染。

本期精选12篇AI领域最新论文，涵盖视听交互数据集、强化学习、具身推理、大型模型测试、动态递归计算、语言模型解码、通用判别模型、动态视角合成、数学LLM优化、韩国LLM基准、图像条件海报设计及Favicon隐写术等前沿技术，展现AI技术的多元发展与创新应用。

🗣 SpeakerVid-5M是一个大规模高质量数据集，专门用于视听二元交互式虚拟人生成，为相关研究提供关键数据支持。

🤔 数据污染会严重影响强化学习结果，导致模型表现不可靠，需要关注数据质量和清洗方法。

🤖 EmbRACE-3K专注于复杂环境中的具身推理与行动，推动AI在真实场景中的智能应用能力提升。

🤔 REST方法通过同时提问多个问题来压力测试大型推理模型，评估其在复杂任务下的稳定性和效率。

🧮 Mixture-of-Recursions技术学习动态递归深度，实现自适应Token级别计算，优化模型处理复杂序列的能力。

🧠 LayerCake在大语言模型层内实现Token感知对比解码，提升模型对Token级信息的理解和生成质量。

⚖ CompassJudger-2通过可验证奖励机制，致力于构建通用判别模型，增强模型评估的客观性和准确性。

🎬 MoVieS能在秒级内实现运动感知的四维动态视角合成，为视频内容和虚拟现实提供高效渲染方案。

🧮 数学LLM的优化方案采用监督微调和强化学习两阶段策略，有效提升模型在数学领域的准确率和效率。

🇰 KMMLU-Redux到KMMLU-Pro是韩国开发的专业LLM评估基准套件，为LLM在韩国语境下的性能测试提供标准。

🖼 DreamPoster提供统一框架，支持图像条件生成海报设计，简化创意海报的设计流程，提升设计效率。

🖼 Favicon木马利用ICO Alpha通道实现可执行隐写术，揭示网络安全新威胁，需加强相关防护措施。

本期的 12 篇论文如下：

00:24 🗣 SpeakerVid-5M: A Large-Scale High-Quality Dataset for Audio-Visual Dyadic Interactive Human Generation（SpeakerVid-5M：用于视听二元交互式虚拟人生成的大规模高质量数据集）

01:12 🤔 Reasoning or Memorization? Unreliable Results of Reinforcement Learning Due to Data Contamination（推理还是记忆？数据污染导致强化学习结果不可靠）

02:03 🤖 EmbRACE-3K: Embodied Reasoning and Action in Complex Environments（EmbRACE-3K：复杂环境中的具身推理与行动）

03:02 🤔 REST: Stress Testing Large Reasoning Models by Asking Multiple Problems at Once（REST：通过同时提问多个问题来压力测试大型推理模型）

03:56 🧮 Mixture-of-Recursions: Learning Dynamic Recursive Depths for Adaptive Token-Level Computation（递归混合：学习动态递归深度以实现自适应Token级别计算）

04:46 🧠 LayerCake: Token-Aware Contrastive Decoding within Large Language Model Layers（LayerCake：大语言模型层内的Token感知对比解码）

05:39 ⚖ CompassJudger-2: Towards Generalist Judge Model via Verifiable Rewards（CompassJudger-2：基于可验证奖励的通用判别模型）

06:27 🎬 MoVieS: Motion-Aware 4D Dynamic View Synthesis in One Second（MoVieS：一秒内实现运动感知的四维动态视角合成）

07:18 🧮 A Practical Two-Stage Recipe for Mathematical LLMs: Maximizing Accuracy with SFT and Efficiency with Reinforcement Learning（数学大型语言模型的实用两阶段方案：通过监督微调最大化准确率，通过强化学习优化效率）

08:05 🇰 From KMMLU-Redux to KMMLU-Pro: A Professional Korean Benchmark Suite for LLM Evaluation（从KMMLU-Redux到KMMLU-Pro：用于LLM评估的专业韩国基准套件）

09:08 🖼 DreamPoster: A Unified Framework for Image-Conditioned Generative Poster Design（DreamPoster：一个用于图像条件生成海报设计的统一框架）

09:54 🖼 Favicon Trojans: Executable Steganography Via Ico Alpha Channel Exploitation（Favicon木马：通过ICO Alpha通道利用实现的可执行隐写术）

【关注我们】

您还可以在以下平台找到我们，获得播客内容以外更多信息

小红书: AI速递

Fish AI Reader

AI辅助创作，多种专业模板，深度分析，高质量内容生成。从观点提取到深度思考，FishAI为您提供全方位的创作支持。新版本引入自定义参数，让您的创作更加个性化和精准。

FishAI

鱼阅，AI 时代的下一个智能信息助手，助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

AI论文人工智能强化学习大型语言模型数据集

相关文章

人工智能正在摧毁互联网内容生态系统

阿里云：通义千问API日调用量破亿企业用户破9万

【iThome 2024 CIO大調查系列1】AI、資安和永續變革三箭齊發

鈺登跨入AI，推出搭配英特爾四代Xeon SP與Gaudi2的伺服器

蘋果發表M4晶片，更新iPad產品線

Red Hat推出AI平臺，內建IBM開源Granite模型

【iThome 2024 CIO大調查系列 1｜IT投資趨勢】IT投資布局更多角化，雲端比重明顯增加