热点
关于我们
xx
xx
"
模型量化
" 相关文章
1.93bit版DeepSeek-R1编程超过Claude 4 Sonnet,不用GPU也能运行
智源社区
2025-06-11T11:17:50.000000Z
征程 6EM 常见 QConfig 配置解读与示例
掘金 人工智能
2025-06-01T10:53:05.000000Z
多模态视觉理解大模型推理优化:探索AI的未来
掘金 人工智能
2025-05-22T01:58:07.000000Z
华为曝光两大黑科技!打破推理延迟魔咒,大模型从此「秒回」
掘金 人工智能
2025-05-21T06:08:04.000000Z
纯本地!零代码!一站式完整数据集准备到模型微调全流程!(一)
掘金 人工智能
2025-05-16T03:33:00.000000Z
大模型推理框架RTP-LLM Embedding技术揭秘
阿里技术
2025-04-09T10:06:08.000000Z
从零实现极速LLM推理
OneFlow
2025-04-09T10:05:55.000000Z
大模型推理框架RTP-LLM Embedding技术揭秘
阿里技术
2025-04-03T03:18:00.000000Z
大模型推理框架RTP-LLM Embedding技术揭秘
阿里技术
2025-03-20T05:13:41.000000Z
99%的人都不知道,即使都是671B满血版DeepSeek-R1也可能有巨大差异
云中江树
2025-02-21T16:29:22.000000Z
Google DeepMind Researchers Propose Matryoshka Quantization: A Technique to Enhance Deep Learning Efficiency by Optimizing Multi-Precision Models without Sacrificing Accuracy
MarkTechPost@AI
2025-02-15T20:05:07.000000Z
完整的671B R1塞进本地,详尽教程来了!
Datawhale
2025-02-03T15:51:15.000000Z
完整的671B MoE DeepSeek R1怎么塞进本地化部署?详尽教程大放送!
机器之心
2025-02-02T06:55:07.000000Z
显卡在偷懒?阿里大模型创作平台 MuseAI 极速模型切换技术提升 AI 创作效率
阿里技术
2025-01-13T07:17:29.000000Z
MNN推理框架将大模型放进移动端设备,并达到SOTA推理性能!
魔搭ModelScope社区
2024-12-24T13:15:41.000000Z
Optimizing AI Models with Quanto on H100 GPUs
Hello Paperspace
2024-11-27T08:36:34.000000Z
社区供稿 | 探索 Ovis: 多模态大模型量化的实战指南
智源社区
2024-11-21T03:22:51.000000Z
欢迎 Stable Diffusion 3.5 Large 加入 ? Diffusers
智源社区
2024-11-08T03:13:32.000000Z
微软开源 1.58bit 推理框架:千亿参数模型量化后单 CPU 可跑,速度每秒 5-7 个 token
IT之家
2024-10-22T11:08:43.000000Z
Efficient LLM inference
Artificial Fintelligence
2024-10-22T06:07:41.000000Z