热点
"长上下文" 相关文章
Exploring the Sparse Frontier: How Researchers from Edinburgh, Cohere, and Meta Are Rethinking Attention Mechanisms for Long-Context LLMs
MarkTechPost@AI 2025-04-30T19:50:39.000000Z
迈向长上下文视频生成!NUS团队新作FAR同时实现短视频和长视频预测SOTA,代码已开源
机器之心 2025-04-23T09:55:06.000000Z
GPT-4.1淘汰了4.5!全系列百万上下文,主打一个性价比
智源社区 2025-04-16T02:57:50.000000Z
GPT-4.1淘汰了4.5:主打一个性价比,但仍不如DeepSeek R1
虎嗅 2025-04-15T03:08:08.000000Z
OpenAI发布GPT-4.1 性能暴涨、支持100万tokens上下文
Cnbeta 2025-04-15T01:22:19.000000Z
LIama 4发布重夺开源第一!DeepSeek同等代码能力但参数减一半,一张H100就能跑,还有两万亿参数超大杯
量子位 2025-04-09T10:19:22.000000Z
北大团队提出LongRePS框架:面向长上下文场景的思维链过程监督方案
PaperWeekly 2025-03-13T12:17:53.000000Z
Long-VITA:突破百万Tokens限制!开源多模态大模型新标杆
我爱计算机视觉 2025-03-04T13:40:54.000000Z
可降低GPU内存的推理框架面世:韩国团队通过卸载键值缓存节约英伟达GPU内存,实现18.95倍注意力解码加速
DeepTech深科技 2025-02-28T16:20:57.000000Z
刚刚,DeepSeek发新成果,梁文锋亲自参与,实习生挑大梁,显著加速AI训练推理
36kr-科技 2025-02-18T10:43:34.000000Z
Qwen2.5-1M: 支持100万Tokens上下文的开源Qwen模型
魔搭ModelScope社区 2025-01-28T04:41:07.000000Z
The latest open artifacts (#6): Reasoning models, China's lead in open-source, and a growing multimodal space
Interconnects 2025-01-27T13:12:11.000000Z
追平多模态满血o1,kimi的新模型k1.5 破解了OpenAI的秘密?
硅星人Pro 2025-01-24T16:21:43.000000Z
Kimi和DeepSeek的新模型这几天内同时发布,又是一波让人看不懂的突飞猛进,硅谷的反应也很有意思, 已经不再是惊讶「他们是怎么办到的」,而是变成了「他们是怎...
即刻AI圈子 2025-01-22T13:12:30.000000Z
1M长上下文,满血版Gemini 2.0又一次登上Chatbot Arena榜首
36kr-科技 2025-01-22T10:21:58.000000Z
Kimi硬刚多模态满血版o1,首曝训练细节!强化学习scaling新范式诞生
新智元 2025-01-21T17:16:47.000000Z
Transformer继任者「Titans」来了,上下文记忆瓶颈被打破
Founder Park 2025-01-20T16:07:42.000000Z
Transformer继任者「Titans」来了,上下文记忆瓶颈被打破
智源社区 2025-01-18T08:52:06.000000Z
只有模仿没有创新?国产 AI 用行动打破质疑
36kr 2025-01-17T09:03:31.000000Z
只有模仿没有创新?国产 AI 用行动打破质疑
极客公园 2025-01-17T05:36:57.000000Z