热点
"Mamba" 相关文章
算力终结者来了!华人天团「降维打击」注意力瓶颈,AI狂飙进对数时代
智源社区 2025-06-09T16:38:01.000000Z
Mamba核心作者新作:取代DeepSeek在用的注意力机制,专为推理打造
智源社区 2025-06-02T10:17:58.000000Z
腾讯混元TurboS技术报告首次全公开:560B参数混合Mamba架构,自适应长短链融合
AI前线 2025-05-23T11:51:23.000000Z
大模型设计迎“伽利略时刻”,Meta华人研究员提出轻量级结构Canon层,提升模型推理深度和广度
MIT 科技评论 - 本周热榜 2025-05-07T02:11:43.000000Z
Transformer+Mamba黄金组合!长文推理性能飙升3倍,性能还更强
新智元 2025-04-20T10:06:33.000000Z
AI让你更emo?EmoAgent助你心理更健康;Google DeepMind:新数据如何“诱导”大模型|今日热门论文
智源社区 2025-04-17T02:57:52.000000Z
Cartesia: 3 个月融资 9100 万美元,从 Transformer 到 Mamba 重塑语音 AI
海外独角兽 2025-04-09T10:53:18.000000Z
长视频理解新突破!Mamba混合架构让显存消耗腰斩,处理10万视频token不费力
智源社区 2025-03-28T15:35:21.000000Z
STORM (Spatiotemporal TOken Reduction for Multimodal LLMs): A Novel AI Architecture Incorporating a Dedicated Temporal Encoder between the Image Encoder and the LLM
MarkTechPost@AI 2025-03-11T07:35:16.000000Z
CVPR 2025 | Mamba和局部自注意力的首次碰撞:一种性能强大的混合视觉架构,代码已开源!
我爱计算机视觉 2025-03-10T14:08:30.000000Z
AAAI 2025| S5VH: 基于选择性状态空间的高效自监督视频哈希
魔搭ModelScope社区 2025-02-14T17:02:48.000000Z
轻量化MobileMamba视觉模型来了|浙大/腾讯优图/华中科大联合出品
智源社区 2024-12-02T15:15:53.000000Z
不是RNN的锅!清华团队深入分析长上下文建模中的状态崩溃,Mamba作者点赞
新智元 2024-11-27T08:16:58.000000Z
Advancing AI in 2024: Highlights from 10 Groundbreaking Research Papers
TOPBOTS 2024-11-26T06:17:56.000000Z
Mamba Explained
The Gradient 2024-11-26T05:15:04.000000Z
惨遭拒稿的Mamba,7个月后拿下首届COLM杰出论文,华为俄罗斯实验室等4篇入选
智源社区 2024-10-09T06:53:56.000000Z
陈丹琦等人组织的COLM奖项公布:被ICLR拒稿的Mamba入选杰出论文
机器之心 2024-10-08T07:42:02.000000Z
LIama 3+Mamba强强联手,蒸馏到线性RNN,推理速度提升1.6倍
36kr 2024-09-10T04:33:45.000000Z
3天把Llama训成Mamba,性能不降,推理更快!
智源社区 2024-09-06T05:07:41.000000Z
3天把Llama训成Mamba,性能不降,推理更快
36kr 2024-09-05T07:18:34.000000Z