HuggingFace 每日AI论文速递 01月18日
2025.01.17 | OmniThink提升机器写作深度与新颖性,扩散模型推理扩展提升生成质量。
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

本期介绍了 12 篇论文,涉及机器写作、扩散模型、患者模拟器、动作标记化、推理模型、代码数据集、缓解错位问题、文本到图像生成、纹理网格生成以及视频模型等多个领域的研究内容。

🧠OmniThink 扩展机器写作知识边界

🔍扩散模型推理时的扩展研究

🎨SynthLight 人像重光照技术

🤖FAST 高效动作标记化方法

🧠迈向大型推理模型的研究综述

本期的 12 篇论文如下:

[00:26] ? OmniThink: Expanding Knowledge Boundaries in Machine Writing through Thinking(OmniThink:通过思考扩展机器写作的知识边界)

[01:06] ? Inference-Time Scaling for Diffusion Models beyond Scaling Denoising Steps(扩散模型推理时扩展:超越去噪步骤的扩展)

[01:37] ? Exploring the Inquiry-Diagnosis Relationship with Advanced Patient Simulators(探索高级患者模拟器中的问诊与诊断关系)

[02:09] ? SynthLight: Portrait Relighting with Diffusion Model by Learning to Re-render Synthetic Faces(SynthLight:基于扩散模型的人像重光照技术——通过重新渲染合成人脸学习)

[02:48] ? FAST: Efficient Action Tokenization for Vision-Language-Action Models(FAST:视觉-语言-动作模型的高效动作标记化方法)

[03:23] ? Learnings from Scaling Visual Tokenizers for Reconstruction and Generation(从视觉分词器的扩展中学习重建与生成)

[04:01] ? Towards Large Reasoning Models: A Survey of Reinforced Reasoning with Large Language Models(迈向大型推理模型:基于大语言模型的强化推理研究综述)

[04:35] ? The Heap: A Contamination-Free Multilingual Code Dataset for Evaluating Large Language Models(堆:一个无污染的多语言代码数据集用于评估大型语言模型)

[05:15] ? RLHS: Mitigating Misalignment in RLHF with Hindsight Simulation(RLHS:通过事后模拟缓解RLHF中的错位问题)

[05:54] ? AnyStory: Towards Unified Single and Multiple Subject Personalization in Text-to-Image Generation(AnyStory:面向统一单主体与多主体个性化的文本到图像生成)

[06:36] ? CaPa: Carve-n-Paint Synthesis for Efficient 4K Textured Mesh Generation(CaPa:用于高效4K纹理网格生成的雕刻与绘制合成框架)

[07:18] ? Do generative video models learn physical principles from watching videos?(生成视频模型是否通过观看视频学习物理原理?)

【关注我们】

您还可以在以下平台找到我们,获得播客内容以外更多信息

小红书: AI速递

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

论文研究 多领域 知识拓展
相关文章