推理优化_Fishai

热点

"推理优化" 相关文章

基于 vLLM 的大模型推理服务部署

掘金人工智能 2025-08-01T11:35:11.000000Z

From Roots to Rewards: Dynamic Tree Reasoning with RL

cs.AI updates on arXiv.org 2025-07-18T04:13:42.000000Z

Chunked-Prefills 分块预填充机制详解

掘金人工智能 2025-07-14T03:05:36.000000Z

On the Bias of Next-Token Predictors Toward Systematically Inefficient Reasoning: A Shortest-Path Case Study

cs.AI updates on arXiv.org 2025-07-09T04:01:40.000000Z

工业级Transformer优化手册：混合精度训练+量化部署实战解析

掘金人工智能 2025-06-22T10:53:50.000000Z

舍弃CUDA编程！CMU等用几十行代码将LLM编译成巨型内核，推理延迟可降6.7倍

机器之心 2025-06-21T05:29:14.000000Z

本地化部署DeepSeek-R1蒸馏大模型：基于飞桨PaddleNLP 3.0的实战指南

掘金人工智能 2025-06-21T02:54:39.000000Z

10% KV Cache实现无损数学推理！这个开源方法解决推理大模型「记忆过载」难题

智源社区 2025-06-17T15:28:04.000000Z

Mistral AI Releases Magistral Series: Advanced Chain-of-Thought LLMs for Enterprise and Open-Source Applications

MarkTechPost@AI 2025-06-11T09:25:49.000000Z

High-Entropy Token Selection in Reinforcement Learning with Verifiable Rewards (RLVR) Improves Accuracy and Reduces Training Cost for LLMs

MarkTechPost@AI 2025-06-09T01:40:45.000000Z

MoE推理「王炸」组合：昇腾×盘古让推理性能狂飙6-8倍

机器之心 2025-06-07T07:11:41.000000Z

即插即用！SLOT推理时优化算法，几行代码让大模型性能爆表

PaperWeekly 2025-06-03T06:42:32.000000Z

Mamba核心作者新作：取代DeepSeek在用的注意力机制，专为推理打造

智源社区 2025-06-02T10:17:58.000000Z

Mamba核心作者新作：取代DeepSeek在用的注意力机制，专为推理打造

量子位 2025-06-01T08:37:43.000000Z

华为攻克AI推理「想太多」问题！新方法让大模型推理提速60%，准确率还高了

智源社区 2025-05-30T07:58:19.000000Z

多模态视觉理解大模型推理优化：探索AI的未来

掘金人工智能 2025-05-22T01:58:07.000000Z

ICML 2025 | RLHF太贵太慢？TPO即时对齐新方案，一句话指令搞定偏好优化

PaperWeekly 2025-05-21T06:12:30.000000Z

华为：让DeepSeek的“专家们”动起来，推理延迟降10%！

智源社区 2025-05-21T05:27:53.000000Z

华为：让DeepSeek的“专家们”动起来，推理延迟降10%！

量子位 2025-05-20T08:30:11.000000Z

华为：让DeepSeek的“专家们”动起来推理延迟降10%！

快科技资讯 2025-05-20T05:26:30.000000Z

Copyright © 2019 FISHAI.All Rights Reserved