热点
关于我们
xx
xx
"
模型量化
" 相关文章
【大模型微调】7.日志监控配置与模型量化分享
掘金 人工智能
2025-07-25T10:44:29.000000Z
Enhancing Vaccine Safety Surveillance: Extracting Vaccine Mentions from Emergency Department Triage Notes Using Fine-Tuned Large Language Models
cs.AI updates on arXiv.org
2025-07-11T04:03:57.000000Z
征程 6M 部署 Omnidet 感知模型
掘金 人工智能
2025-07-10T13:19:38.000000Z
DilateQuant: Accurate and Efficient Diffusion Quantization via Weight Dilation
cs.AI updates on arXiv.org
2025-07-10T04:06:06.000000Z
征程 6|工具链量化简介与代码实操
掘金 人工智能
2025-07-09T02:20:11.000000Z
1.93bit版DeepSeek-R1编程超过Claude 4 Sonnet,不用GPU也能运行
智源社区
2025-06-11T11:17:50.000000Z
征程 6EM 常见 QConfig 配置解读与示例
掘金 人工智能
2025-06-01T10:53:05.000000Z
多模态视觉理解大模型推理优化:探索AI的未来
掘金 人工智能
2025-05-22T01:58:07.000000Z
华为曝光两大黑科技!打破推理延迟魔咒,大模型从此「秒回」
掘金 人工智能
2025-05-21T06:08:04.000000Z
纯本地!零代码!一站式完整数据集准备到模型微调全流程!(一)
掘金 人工智能
2025-05-16T03:33:00.000000Z
大模型推理框架RTP-LLM Embedding技术揭秘
阿里技术
2025-04-09T10:06:08.000000Z
从零实现极速LLM推理
OneFlow
2025-04-09T10:05:55.000000Z
大模型推理框架RTP-LLM Embedding技术揭秘
阿里技术
2025-04-03T03:18:00.000000Z
大模型推理框架RTP-LLM Embedding技术揭秘
阿里技术
2025-03-20T05:13:41.000000Z
99%的人都不知道,即使都是671B满血版DeepSeek-R1也可能有巨大差异
云中江树
2025-02-21T16:29:22.000000Z
Google DeepMind Researchers Propose Matryoshka Quantization: A Technique to Enhance Deep Learning Efficiency by Optimizing Multi-Precision Models without Sacrificing Accuracy
MarkTechPost@AI
2025-02-15T20:05:07.000000Z
完整的671B R1塞进本地,详尽教程来了!
Datawhale
2025-02-03T15:51:15.000000Z
完整的671B MoE DeepSeek R1怎么塞进本地化部署?详尽教程大放送!
机器之心
2025-02-02T06:55:07.000000Z
显卡在偷懒?阿里大模型创作平台 MuseAI 极速模型切换技术提升 AI 创作效率
阿里技术
2025-01-13T07:17:29.000000Z
MNN推理框架将大模型放进移动端设备,并达到SOTA推理性能!
魔搭ModelScope社区
2024-12-24T13:15:41.000000Z