长文本_Fishai

热点

"长文本" 相关文章

杨植麟的反击

钛媒体：引领未来商业与生活新知 2025-07-23T11:01:44.000000Z

杨植麟的反击

36kr-科技 2025-07-23T08:49:59.000000Z

【ICML2025】大模型训练性能4倍提升！阿里云PAI团队研究成果ChunkFlow中选

掘金人工智能 2025-07-17T07:50:57.000000Z

4B小模型数学推理首超Claude 4，700步RL训练逼近235B性能 | 港大&字节Seed&复旦

量子位 2025-07-09T07:14:47.000000Z

性能比肩DeepSeek-R1，MiniMax仅花380万训出推理大模型性价比新王｜开源

智源社区 2025-06-18T04:12:47.000000Z

性能比肩 DeepSeek-R1，MiniMax 仅花 380 万训出推理大模型性价比新王｜开源

掘金人工智能 2025-06-17T10:36:17.000000Z

MiniMax开源超强性价比推理模型，未来四天连续“上新” | 云启伙伴

云启资本 2025-06-17T10:05:31.000000Z

AI 创业者的反思：那些被忽略的「快」与「长」

智源社区 2025-06-11T14:03:31.000000Z

阿里开源长文本深度思考模型！渐进式强化学习破解长文本训练难题，登HuggingFace热榜

智源社区 2025-05-29T01:52:53.000000Z

Technology Innovation Institute TII Releases Falcon-H1: Hybrid Transformer-SSM Language Models for Scalable, Multilingual, and Long-Context Understanding

MarkTechPost@AI 2025-05-22T06:50:51.000000Z

IBM AI Releases Granite 4.0 Tiny Preview: A Compact Open-Language Model Optimized for Long-Context and Instruction Tasks

MarkTechPost@AI 2025-05-04T01:50:41.000000Z

Sequential-NIAH: A Benchmark for Evaluating LLMs in Extracting Sequential Information from Long Texts

MarkTechPost@AI 2025-04-24T05:55:36.000000Z

刚刚，OpenAI 发布 GPT-4.1 ！吊打 GPT-4.5，14 万/月的博士级 AI 曝光

APPSO 2025-04-19T06:36:13.000000Z

哇塞，拯救长上下文的新注意力架构NSA， DeepSeek告诉你，什么是高质量的降本增效

FishAI官方 2025-04-09T10:03:05.000000Z

阿里通义千问推出 Qwen2.5-1M 开源模型，支持 100 万 Tokens 上下文

IT之家 2025-01-26T23:35:07.000000Z

MiniMax 深夜首次开源，400万长文本，全新架构，挑战Transformer

橘子汽水铺 2025-01-19T13:02:33.000000Z

国产 LLM 扎堆开源的一周~

PaperAgent 2025-01-19T12:59:44.000000Z

MiniMax开年甩出一张王炸

虎嗅 2025-01-18T12:52:32.000000Z

打脸，GPT-4o输出长度8k都勉强，陈丹琦团队新基准测试：所有模型输出都低于标称长度

36kr-科技 2025-01-15T11:52:58.000000Z

混乱、分裂、吞并：2024年AI的信仰之战

钛媒体：引领未来商业与生活新知 2025-01-14T02:56:31.000000Z

Copyright © 2019 FISHAI.All Rights Reserved