热点
关于我们
xx
xx
"
推理优化
" 相关文章
Mistral AI Releases Magistral Series: Advanced Chain-of-Thought LLMs for Enterprise and Open-Source Applications
MarkTechPost@AI
2025-06-11T09:25:49.000000Z
High-Entropy Token Selection in Reinforcement Learning with Verifiable Rewards (RLVR) Improves Accuracy and Reduces Training Cost for LLMs
MarkTechPost@AI
2025-06-09T01:40:45.000000Z
MoE推理「王炸」组合:昇腾×盘古让推理性能狂飙6-8倍
机器之心
2025-06-07T07:11:41.000000Z
即插即用!SLOT推理时优化算法,几行代码让大模型性能爆表
PaperWeekly
2025-06-03T06:42:32.000000Z
Mamba核心作者新作:取代DeepSeek在用的注意力机制,专为推理打造
智源社区
2025-06-02T10:17:58.000000Z
Mamba核心作者新作:取代DeepSeek在用的注意力机制,专为推理打造
量子位
2025-06-01T08:37:43.000000Z
华为攻克AI推理「想太多」问题!新方法让大模型推理提速60%,准确率还高了
智源社区
2025-05-30T07:58:19.000000Z
多模态视觉理解大模型推理优化:探索AI的未来
掘金 人工智能
2025-05-22T01:58:07.000000Z
ICML 2025 | RLHF太贵太慢?TPO即时对齐新方案,一句话指令搞定偏好优化
PaperWeekly
2025-05-21T06:12:30.000000Z
华为:让DeepSeek的“专家们”动起来,推理延迟降10%!
智源社区
2025-05-21T05:27:53.000000Z
华为:让DeepSeek的“专家们”动起来,推理延迟降10%!
量子位
2025-05-20T08:30:11.000000Z
华为:让DeepSeek的“专家们”动起来 推理延迟降10%!
快科技资讯
2025-05-20T05:26:30.000000Z
北大、小米团队:多头潜注意力Is All You Need|大模型论文
智源社区
2025-05-19T12:18:57.000000Z
大模型推理框架RTP-LLM对DeepSeek-V3的优化实践
阿里技术
2025-05-14T04:13:54.000000Z
全球首个,最接近原版DeepSeek开源复现来了!R1四个月狂飙26倍
新智元
2025-05-09T06:19:50.000000Z
超越DeepSeek-R1,英伟达开源新王登顶!14万H100小时训练细节全曝光
智源社区
2025-05-07T06:47:14.000000Z
超越 DeepSeek-R1,英伟达开源模型 Llama-Nemotron 登顶
IT之家
2025-05-06T09:18:09.000000Z
超越 DeepSeek-R1,英伟达开源新王登顶!14 万 H100 小时训练细节全曝光
掘金 人工智能
2025-05-06T09:03:15.000000Z
52页PPT,谷歌Gemini预训练负责人首次揭秘,扩展定律最优解
36kr
2025-04-28T11:43:57.000000Z
腾讯、华为、微软、阿里专家齐聚一堂,共谈推理优化实践 | AICon
AI前线
2025-04-23T09:14:06.000000Z