热点
关于我们
xx
xx
"
小模型
" 相关文章
3B超越DeepSeek,大模型终于理解时间了!Time-R1一统过去/未来/生成
智源社区
2025-06-10T06:43:09.000000Z
端侧AI的未来:苹果能否凭借“小模型”逆袭?
36氪 - 科技频道
2025-06-10T06:24:48.000000Z
3B超越DeepSeek,大模型终于理解时间了,Time-R1一统过去/未来/生成
36kr-科技
2025-06-09T12:13:42.000000Z
英伟达揭示RL Scaling魔力,训练步数翻倍=推理能力质变,小模型突破推理极限
36氪 - 科技频道
2025-06-04T09:49:12.000000Z
炸裂!MistralAI 新模型 Devstral-Small 来了:236亿参数,凭啥在软件工程榜单上碾压千亿巨头?
掘金 人工智能
2025-05-23T02:13:07.000000Z
小米开源MiMo-7B!从预训练到强化学习,解锁语言模型的推理潜能
魔搭ModelScope社区
2025-05-14T20:21:55.000000Z
小米开源MiMo-7B!从预训练到强化学习,解锁语言模型的推理潜能
魔搭ModelScope社区
2025-05-14T14:54:26.000000Z
一周内斩获20K Star!这款国产开源AI在海外杀疯了
掘金 人工智能
2025-05-10T02:03:01.000000Z
Ai2’s new small AI model outperforms similarly-sized models from Google, Meta
TechCrunch News
2025-05-01T18:36:30.000000Z
小模型工具调用能力激活:以Qwen2.5 0.5B为例的Prompt工程实践
掘金 人工智能
2025-04-27T04:43:01.000000Z
漫画趣解:一口气搞懂模型蒸馏!
特大号
2025-04-09T09:54:29.000000Z
解密prompt系列51. R1实验的一些细节讨论
掘金 人工智能
2025-04-02T23:42:45.000000Z
小了 60,500 倍,但更强;AI 的“深度诅咒”
掘金 人工智能
2025-04-01T11:32:47.000000Z
240元打造擅长数学的多模态版R1,基于DeepSeek核心思想,两阶段训练提升推理能力至工业级应用标准
智源社区
2025-03-20T11:39:48.000000Z
参数即权力?小模型如何用“减法逻辑”重构AI基础设施|DeepTalk对话清华大学韩旭
DeepTech深科技
2025-03-20T05:11:59.000000Z
32B击败DeepSeek-R1、o3-mini,成本暴降100倍!GRPO让小模型称霸推理
智源社区
2025-03-08T10:15:21.000000Z
DeepSeek推出后,移动端AI风向要变
机器之心
2025-03-04T05:11:52.000000Z
微软首个多模态Phi-4问世,56亿参数秒杀GPT-4o!LoRA华人大佬带队
新智元
2025-03-01T16:31:50.000000Z
微软首个多模态Phi-4问世,56亿参数秒杀GPT-4o!LoRA华人大佬带队
智源社区
2025-03-01T02:07:15.000000Z
德勤:2025年全球AI芯片规模预计超1500亿美元,2027年增至4000亿美元|钛媒体AGI
钛媒体:引领未来商业与生活新知
2025-02-26T15:31:09.000000Z