热点
关于我们
xx
xx
"
语言建模
" 相关文章
AI自我纠错,Diffusion超越自回归!质量提升55%,已达理论证据下界
新智元
2025-04-09T10:06:21.000000Z
无需Attention的未来,RWKV-7能成为替代Transformer的那只黑天鹅吗?
硅星人Pro
2025-04-09T10:03:33.000000Z
AI自我纠错,Diffusion超越自回归!质量提升55%,已达理论证据下界
新智元
2025-03-23T07:07:56.000000Z
小模型指导大模型!田渊栋等爆锤蒸馏:新方法更高效、更透明、更可控
智源社区
2025-03-03T05:07:14.000000Z
小模型指导大模型!田渊栋等爆锤蒸馏:新方法更高效、更透明、更可控
新智元
2025-03-02T06:16:47.000000Z
资讯 | Meta | 大概念模型 (Large Concept Models):颠覆大语言模型 (LLMs) ?
智源社区
2025-01-08T16:18:38.000000Z
Tokenization,再见!Meta提出大概念模型LCM,1B模型干翻70B?
智源社区
2025-01-08T10:00:15.000000Z
Tokenization,再见,Meta提出大概念模型LCM,1B模型干翻70B?
36kr-科技
2025-01-07T10:31:26.000000Z
Meta最新研究:无需Tokenizer的架构!
Datawhale
2024-12-18T14:11:27.000000Z
RNN回归!Bengio新作大道至简与Transformer一较高下
新智元
2024-10-28T14:26:08.000000Z
Jurgen、曼宁等大佬新作:MoE重塑6年前的Universal Transformer,高效升级
机器之心
2024-10-19T08:11:44.000000Z
陈丹琦等人组织的COLM奖项公布:被ICLR拒稿的Mamba入选杰出论文
机器之心
2024-10-08T07:42:02.000000Z
Gated Slot Attention: Advancing Linear Attention Models for Efficient and Effective Language Processing
MarkTechPost@AI
2024-09-22T05:20:33.000000Z
Meta presents Transfusion: A Recipe for Training a Multi-Modal Model Over Discrete and Continuous Data
MarkTechPost@AI
2024-08-27T02:29:32.000000Z
ICML最佳论文曾被ICLR拒稿,Pika联创参与,一作已入职OpenAI
量子位
2024-07-27T04:23:54.000000Z
ICML最佳论文曾被ICLR拒稿,Pika联创参与,一作已入职OpenAI
36kr
2024-07-25T10:02:52.000000Z
7月11日直播|简单而强大,混合神经网络架构,支持无限上下文的混合模型 Samba
智源社区
2024-07-09T05:05:49.000000Z
What the Human Brain Can Tell Us About NLP Models with Allyson Ettinger - #483
The TWIML AI Podcast (formerly This Week in Machine Learning & Artificial Intelligence)
2024-05-12T03:02:26.000000Z
Language Modeling With State Space Models with Dan Fu - #630
The TWIML AI Podcast (formerly This Week in Machine Learning & Artificial Intelligence)
2024-05-12T02:02:24.000000Z
xLSTM: Enhancing Long Short-Term Memory LSTM Capabilities for Advanced Language Modeling and Beyond
MarkTechPost@AI
2024-05-10T16:27:41.000000Z