量化_Fishai

热点

"量化" 相关文章

Accumulator-Aware Post-Training Quantization for Large Language Models

cs.AI updates on arXiv.org 2025-08-01T04:08:14.000000Z

The Effect of Compression Techniques on Large Multimodal Language Models in the Medical Domain

cs.AI updates on arXiv.org 2025-07-30T04:12:05.000000Z

大模型推理加速实战，vLLM 部署 Llama3 的量化与批处理优化指南

掘金人工智能 2025-07-22T11:11:36.000000Z

大模型 “瘦身术”：量化与蒸馏背后的秘密

掘金人工智能 2025-07-19T09:38:48.000000Z

4倍无损压缩Diffusion，6倍加速！仅需时间特征维护 | TPAMI'25

智源社区 2025-07-12T09:39:11.000000Z

4倍无损压缩Diffusion，6倍加速！仅需时间特征维护 | TPAMI'25

新智元 2025-07-10T16:59:23.000000Z

Jina Embeddings v4 的量化感知训练

Jina AI 2025-07-09T11:44:11.000000Z

Smaller = Weaker? Benchmarking Robustness of Quantized LLMs in Code Generation

cs.AI updates on arXiv.org 2025-07-01T04:13:55.000000Z

监管持续从严，私募注销上半年“主动退出”多于“被动清退”，存量优化加速中

深度财经头条 2025-06-30T23:59:58.000000Z

股价一举突破200元！相机龙头获20cm长阳，活跃资金动作频频，这些席位常登龙虎榜

深度财经头条 2025-06-18T09:29:58.000000Z

技术前沿：MCP如何重塑大模型性能架构

掘金人工智能 2025-06-11T09:34:02.000000Z

微软再放LLM量化大招，原生4bit量化，成本暴减，性能几乎0损失

36kr 2025-06-03T03:55:06.000000Z

微软再放LLM量化大招！原生4bit量化，成本暴减，性能几乎0损失

新智元 2025-06-01T06:29:26.000000Z

炸裂！DeepSeek 8B 量化版降临：告别显存焦虑，你的 3080 Ti 也能玩转顶级大模型了！

掘金人工智能 2025-05-31T03:03:04.000000Z

华为中科大联创大模型低比特量化算法，1‰数据实现昇腾无损压缩7倍

新智元 2025-05-26T06:37:06.000000Z

华为中科大联创大模型低比特量化算法，1‰数据实现昇腾无损压缩 7 倍

掘金人工智能 2025-05-26T03:53:01.000000Z

大模型微调实战进阶：从原理到单卡训练LLaMA-7B实战

掘金人工智能 2025-05-20T09:08:00.000000Z

TensorFlow模型转换与优化：流程解析

掘金人工智能 2025-05-16T10:28:15.000000Z

大语言模型的训练后量化算法综述 | 得物技术

得物技术 2025-05-14T12:27:57.000000Z

ICML 2025 | 注意力机制中的极大值：破解大语言模型上下文理解的关键

机器之心 2025-05-06T07:41:38.000000Z

Copyright © 2019 FISHAI.All Rights Reserved