热点
关于我们
xx
xx
"
长文本
" 相关文章
杨植麟的反击
钛媒体:引领未来商业与生活新知
2025-07-23T11:01:44.000000Z
杨植麟的反击
36kr-科技
2025-07-23T08:49:59.000000Z
【ICML2025】大模型训练性能4倍提升!阿里云PAI团队研究成果ChunkFlow中选
掘金 人工智能
2025-07-17T07:50:57.000000Z
4B小模型数学推理首超Claude 4,700步RL训练逼近235B性能 | 港大&字节Seed&复旦
量子位
2025-07-09T07:14:47.000000Z
性能比肩DeepSeek-R1,MiniMax仅花380万训出推理大模型性价比新王|开源
智源社区
2025-06-18T04:12:47.000000Z
性能比肩 DeepSeek-R1,MiniMax 仅花 380 万训出推理大模型性价比新王|开源
掘金 人工智能
2025-06-17T10:36:17.000000Z
MiniMax开源超强性价比推理模型,未来四天连续“上新” | 云启伙伴
云启资本
2025-06-17T10:05:31.000000Z
AI 创业者的反思:那些被忽略的「快」与「长」
智源社区
2025-06-11T14:03:31.000000Z
阿里开源长文本深度思考模型!渐进式强化学习破解长文本训练难题,登HuggingFace热榜
智源社区
2025-05-29T01:52:53.000000Z
Technology Innovation Institute TII Releases Falcon-H1: Hybrid Transformer-SSM Language Models for Scalable, Multilingual, and Long-Context Understanding
MarkTechPost@AI
2025-05-22T06:50:51.000000Z
IBM AI Releases Granite 4.0 Tiny Preview: A Compact Open-Language Model Optimized for Long-Context and Instruction Tasks
MarkTechPost@AI
2025-05-04T01:50:41.000000Z
Sequential-NIAH: A Benchmark for Evaluating LLMs in Extracting Sequential Information from Long Texts
MarkTechPost@AI
2025-04-24T05:55:36.000000Z
刚刚,OpenAI 发布 GPT-4.1 !吊打 GPT-4.5,14 万/月的博士级 AI 曝光
APPSO
2025-04-19T06:36:13.000000Z
哇塞,拯救长上下文的新注意力架构NSA, DeepSeek告诉你,什么是高质量的降本增效
FishAI官方
2025-04-09T10:03:05.000000Z
阿里通义千问推出 Qwen2.5-1M 开源模型,支持 100 万 Tokens 上下文
IT之家
2025-01-26T23:35:07.000000Z
MiniMax 深夜首次开源,400万长文本,全新架构,挑战Transformer
橘子汽水铺
2025-01-19T13:02:33.000000Z
国产 LLM 扎堆开源的一周~
PaperAgent
2025-01-19T12:59:44.000000Z
MiniMax开年甩出一张王炸
虎嗅
2025-01-18T12:52:32.000000Z
打脸,GPT-4o输出长度8k都勉强,陈丹琦团队新基准测试:所有模型输出都低于标称长度
36kr-科技
2025-01-15T11:52:58.000000Z
混乱、分裂、吞并:2024年AI的信仰之战
钛媒体:引领未来商业与生活新知
2025-01-14T02:56:31.000000Z