热点
"推理优化" 相关文章
基于 vLLM 的大模型推理服务部署
掘金 人工智能 2025-08-01T11:35:11.000000Z
From Roots to Rewards: Dynamic Tree Reasoning with RL
cs.AI updates on arXiv.org 2025-07-18T04:13:42.000000Z
Chunked-Prefills 分块预填充机制详解
掘金 人工智能 2025-07-14T03:05:36.000000Z
On the Bias of Next-Token Predictors Toward Systematically Inefficient Reasoning: A Shortest-Path Case Study
cs.AI updates on arXiv.org 2025-07-09T04:01:40.000000Z
工业级Transformer优化手册:混合精度训练+量化部署实战解析​
掘金 人工智能 2025-06-22T10:53:50.000000Z
舍弃CUDA编程!CMU等用几十行代码将LLM编译成巨型内核,推理延迟可降6.7倍
机器之心 2025-06-21T05:29:14.000000Z
本地化部署DeepSeek-R1蒸馏大模型:基于飞桨PaddleNLP 3.0的实战指南
掘金 人工智能 2025-06-21T02:54:39.000000Z
10% KV Cache实现无损数学推理!这个开源方法解决推理大模型「记忆过载」难题
智源社区 2025-06-17T15:28:04.000000Z
Mistral AI Releases Magistral Series: Advanced Chain-of-Thought LLMs for Enterprise and Open-Source Applications
MarkTechPost@AI 2025-06-11T09:25:49.000000Z
High-Entropy Token Selection in Reinforcement Learning with Verifiable Rewards (RLVR) Improves Accuracy and Reduces Training Cost for LLMs
MarkTechPost@AI 2025-06-09T01:40:45.000000Z
MoE推理「王炸」组合:昇腾×盘古让推理性能狂飙6-8倍
机器之心 2025-06-07T07:11:41.000000Z
即插即用!SLOT推理时优化算法,几行代码让大模型性能爆表
PaperWeekly 2025-06-03T06:42:32.000000Z
Mamba核心作者新作:取代DeepSeek在用的注意力机制,专为推理打造
智源社区 2025-06-02T10:17:58.000000Z
Mamba核心作者新作:取代DeepSeek在用的注意力机制,专为推理打造
量子位 2025-06-01T08:37:43.000000Z
华为攻克AI推理「想太多」问题!新方法让大模型推理提速60%,准确率还高了
智源社区 2025-05-30T07:58:19.000000Z
多模态视觉理解大模型推理优化:探索AI的未来
掘金 人工智能 2025-05-22T01:58:07.000000Z
ICML 2025 | RLHF太贵太慢?TPO即时对齐新方案,一句话指令搞定偏好优化
PaperWeekly 2025-05-21T06:12:30.000000Z
华为:让DeepSeek的“专家们”动起来,推理延迟降10%!
智源社区 2025-05-21T05:27:53.000000Z
华为:让DeepSeek的“专家们”动起来,推理延迟降10%!
量子位 2025-05-20T08:30:11.000000Z
华为:让DeepSeek的“专家们”动起来 推理延迟降10%!
快科技资讯 2025-05-20T05:26:30.000000Z