热点
"小模型" 相关文章
小模型工具调用能力激活:以Qwen2.5 0.5B为例的Prompt工程实践
掘金 人工智能 2025-04-27T04:43:01.000000Z
漫画趣解:一口气搞懂模型蒸馏!
特大号 2025-04-09T09:54:29.000000Z
解密prompt系列51. R1实验的一些细节讨论
掘金 人工智能 2025-04-02T23:42:45.000000Z
小了 60,500 倍,但更强;AI 的“深度诅咒”
掘金 人工智能 2025-04-01T11:32:47.000000Z
240元打造擅长数学的多模态版R1,基于DeepSeek核心思想,两阶段训练提升推理能力至工业级应用标准
智源社区 2025-03-20T11:39:48.000000Z
参数即权力?小模型如何用“减法逻辑”重构AI基础设施|DeepTalk对话清华大学韩旭
DeepTech深科技 2025-03-20T05:11:59.000000Z
32B击败DeepSeek-R1、o3-mini,成本暴降100倍!GRPO让小模型称霸推理
智源社区 2025-03-08T10:15:21.000000Z
DeepSeek推出后,移动端AI风向要变
机器之心 2025-03-04T05:11:52.000000Z
微软首个多模态Phi-4问世,56亿参数秒杀GPT-4o!LoRA华人大佬带队
新智元 2025-03-01T16:31:50.000000Z
微软首个多模态Phi-4问世,56亿参数秒杀GPT-4o!LoRA华人大佬带队
智源社区 2025-03-01T02:07:15.000000Z
德勤:2025年全球AI芯片规模预计超1500亿美元,2027年增至4000亿美元|钛媒体AGI
钛媒体:引领未来商业与生活新知 2025-02-26T15:31:09.000000Z
小模型路线图来了!苹果弄清楚了“蒸馏Scaling Law“
华尔街见闻 - 资讯 - undefined 2025-02-18T09:58:24.000000Z
7B 小模型:如何用 8000 个示例,“炼”出会自我反思的 AI?
宝玉的分享 2025-02-17T14:48:56.000000Z
啊?7B的DeepSeek反超R1满血版,上海AI Lab周伯文团队新成果:计算最优的Test-Time Scaling
智源社区 2025-02-13T09:33:15.000000Z
清华一作1B暴打405B巨无霸,7B逆袭DeepSeek R1,测试时Scaling封神
36氪 - 科技频道 2025-02-12T08:57:45.000000Z
Z世代70%时间用在AI应用上,传统搜索已被抛弃?
虎嗅-AI 2025-02-10T07:15:00.000000Z
DeepSeek技术解析:如何冲击英伟达两大壁垒?
钛媒体:引领未来商业与生活新知 2025-02-08T05:55:09.000000Z
硅谷投资人张璐:Z世代70%时间用在AI应用上,传统搜索已被抛弃?
36氪 - 科技频道 2025-02-08T01:18:30.000000Z
北航团队提出专家协同框架,小尺寸大模型协同效果或优于“巨无霸”大模型
MIT 科技评论 - 本周热榜 2025-01-30T01:28:37.000000Z
深度|Latent Space第100期内容:2024年度AI回顾
Z Potentials 2025-01-25T17:07:13.000000Z