热点
"工具使用" 相关文章
超越90%用户的秘密,藏在那本被你丢弃的说明书里
辉哥奇谭 2025-06-03T01:41:59.000000Z
构建自主智能系统——赋能智能体的工具使用与规划能力
掘金 人工智能 2025-05-30T03:23:06.000000Z
⚡️Multi-Turn RL for Multi-Hour Agents — with Will Brown, Prime Intellect
Latent 2025-05-23T03:25:24.000000Z
巴拿马孤岛惊现偷娃狂魔!卷尾猴多次偷走吼猴幼崽
快科技资讯 2025-05-20T23:16:27.000000Z
【LLM RL】论文分享No.9:SWiRL(Multi-Step)
掘金 人工智能 2025-05-16T03:03:02.000000Z
Reinforcement Learning, Not Fine-Tuning: Nemotron-Tool-N1 Trains LLMs to Use Tools with Minimal Supervision and Maximum Generalization
MarkTechPost@AI 2025-05-13T20:30:39.000000Z
字节ReTool:用于大模型中战略性工具使用的强化学习
PaperAgent 2025-05-08T07:22:59.000000Z
OTC‑PO重磅发布 | 揭开 o3 神秘面纱,让 Agent 少用工具、多动脑子!
机器之心 2025-05-07T07:32:19.000000Z
OTC‑PO重磅发布 | 揭开 o3 神秘面纱,让 Agent 少用工具、多动脑子!
掘金 人工智能 2025-05-07T05:43:04.000000Z
【LLM SFT & RL】论文分享No.4:AutoCoA
掘金 人工智能 2025-05-01T09:48:06.000000Z
首个系统性工具使用奖励范式,ToolRL刷新大模型训练思路
机器之心 2025-04-28T12:06:15.000000Z
OpenAI:computer use 处于 GPT-2 阶段,模型公司的使命是让 agent 产品化
海外独角兽 2025-04-23T15:08:00.000000Z
扣子空间的系统提示词 —— { "system_prompt": "你是任务执行专家,擅长根据用户的需求,调用多个工具完成当前任务。", "role": "任务执行专家", "function_res...
AI探索站 - 即刻圈子 2025-04-22T05:34:14.000000Z
【国盛计算机】OpenAI发布o3与o4-mini,视觉推理与工具使用突破
国盛计算机 2025-04-20T16:34:33.000000Z
Kling 2.0: uncanny valley crossed — video creation will never be the same
Coding with Intelligence 2025-04-18T14:55:58.000000Z
o3视觉推理,暴打了Gemini 2.5 Pro和Claude 3.7 Thinking
夕小瑶科技说 2025-04-18T13:17:41.000000Z
再见Workflows,你好Agentic Workflows!
PaperAgent 2025-04-09T10:32:30.000000Z
自动学会工具解题,RL扩展催化奥数能力激增17%
掘金 人工智能 2025-04-01T10:57:46.000000Z
How Do LLMs Reason? 5 Approaches Powering the Next Generation of AI
TOPBOTS 2025-03-21T15:43:36.000000Z
Tool choice with Amazon Nova models
AWS Machine Learning Blog 2025-03-20T14:00:22.000000Z