热点
"MagicPIG" 相关文章
把注意力计算丢给CPU,大模型解码吞吐量提高1.76~4.99倍
智源社区 2024-12-28T05:01:57.000000Z
把注意力计算丢给CPU,大模型解码吞吐量提高1.76~4.99倍
36kr-科技 2024-12-27T08:44:07.000000Z