HuggingFace 每日AI论文速递 04月30日 07:07
2025.04.29 | RepText提升多语言文本渲染;LLM改进手机GUI自动化。
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

本期AI速递精选11篇前沿论文,涵盖视觉文本渲染、手机GUI代理、LLM推理能力、临床知识应用、群等变抗锯齿降采样、可信多模态几何问题求解、LLM推理能力提升、多模态数学推理基准测试、长文本VLM加速、上下文学习量化以及LLM在硬件开发中的应用。这些研究探索了AI在不同领域的最新进展,旨在提升AI系统的性能、可靠性和应用范围,为未来的AI发展方向提供新的思路和方法。

✍️ **RepText**: 提出了一种通过复制渲染视觉文本的方法。

📱 **LLM驱动的手机GUI代理**: 调研了LLM在手机自动化方面的进展与前景。

🔐 **CipherBank**: 通过密码学挑战探索大型语言模型推理能力的边界。

🤔 **LLM临床知识局限**: 指出大型语言模型中的临床知识未能有效转化为人际互动。

🚀 **MMInference加速VLM**: 通过模态感知置换稀疏注意力加速长文本VLM的预填充。

本期的 11 篇论文如下:

[00:23] ✍ RepText: Rendering Visual Text via Replicating(RepText:通过复制渲染视觉文本)

[01:02] 📱 LLM-Powered GUI Agents in Phone Automation: Surveying Progress and Prospects(LLM驱动的手机GUI代理:进展与展望)

[01:44] 🔐 CipherBank: Exploring the Boundary of LLM Reasoning Capabilities through Cryptography Challenges(CipherBank:通过密码学挑战探索大型语言模型推理能力的边界)

[02:30] 🤔 Clinical knowledge in LLMs does not translate to human interactions(大型语言模型中的临床知识未能转化为人际互动)

[03:16] ⬇ Group Downsampling with Equivariant Anti-aliasing(群等变抗锯齿降采样)

[03:59] 📐 TrustGeoGen: Scalable and Formal-Verified Data Engine for Trustworthy Multi-modal Geometric Problem Solving(TrustGeoGen:用于可信多模态几何问题求解的可扩展且形式验证的数据引擎)

[04:39] 🤖 SPC: Evolving Self-Play Critic via Adversarial Games for LLM Reasoning(SPC:通过对抗博弈演进自博弈评论器以提升大型语言模型推理能力)

[05:30] 🖼 Benchmarking Multimodal Mathematical Reasoning with Explicit Visual Dependency(基于显式视觉依赖的多模态数学推理能力基准测试)

[06:15] 🚀 MMInference: Accelerating Pre-filling for Long-Context VLMs via Modality-Aware Permutation Sparse Attention(MMInference:通过模态感知置换稀疏注意力加速长文本VLM的预填充)

[06:49] 🔑 ICL CIPHERS: Quantifying "Learning'' in In-Context Learning via Substitution Ciphers(ICL密码:通过替换密码量化上下文学习中的“学习”)

[07:30] 💡 ChiseLLM: Unleashing the Power of Reasoning LLMs for Chisel Agile Hardware Development(ChiseLLM:释放推理LLM在Chisel敏捷硬件开发中的力量)

【关注我们】

您还可以在以下平台找到我们,获得播客内容以外更多信息

小红书: AI速递

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

AI论文 前沿技术 LLM 多模态学习 AI应用
相关文章