机器之心 2024年11月15日
Claude都能操纵计算机了,吴恩达:智能体工作流越来越成熟
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

随着智能体研究的兴起,大型语言模型(LLM)的优化方向正从单纯的回答问题转向适应智能体工作流程。吴恩达教授指出,这种趋势将极大地提升智能体性能。过去,LLM主要被优化为回答问题或遵循指令,但智能体需要更复杂的能力,例如反思输出、使用工具、规划和协作。因此,模型制造商开始优化模型以支持工具使用,如函数调用,并让LLM能够搜索信息、执行代码等。Anthropic的Claude 3.5 Sonnet就是一个例子,它能够像人一样使用计算机。未来,开发人员将更多地利用prompt来引导LLM执行智能体行为,并在特定任务中微调模型以提升可靠性。LLM提供商也开始将工具使用等能力直接构建到模型中,这将进一步提升智能体能力,推动未来几年智能体技术的快速发展。

🤔 **LLM优化方向转变**: 从以提供良好消费者体验为目标,转向适应智能体工作流程,例如反思输出、使用工具、规划和协作等。

🧰 **工具使用成为优化重点**: LLM开始支持函数调用,能够调用API获取信息、执行代码、发送邮件等,例如GPT-4原生支持函数调用。

🖥️ **智能体原生使用计算机**: Anthropic的Claude 3.5 Sonnet等模型能够像人一样使用计算机,推动新一代RPA应用的开发。

🔄 **Prompt与微调相结合**: 开发人员可以通过prompt引导LLM执行智能体行为,并在特定任务中微调模型以提升可靠性,例如针对特定函数调用进行模型微调。

💡 **LLM提供商构建智能体能力**: 主要LLM提供商开始将工具使用等能力直接构建到模型中,例如OpenAI o1-preview的高级推理能力,这将进一步提升智能体性能。

2024-11-15 12:34 北京

优化似乎有了新的方向。

机器之心报道

编辑:小舟


受 ChatGPT 强大问答能力的影响,大型语言模型(LLM)提供商往往优化模型来回答人们的问题,以提供良好的消费者体验。


随着智能体研究日趋成熟,优化似乎有了新的方向。


人工智能著名学者、斯坦福大学教授吴恩达今天指出:「现在有一种趋势是优化模型以适应智能体工作流程,这将为智能体性能带来巨大提升」,并撰写一篇博客简单阐述了这种趋势。



我们对博客内容进行了不改变原意的编译、整理,以下是博客内容:


继 ChatGPT 在回答问题方面取得突破性成功之后,许多 LLM 的开发都集中在提供良好的消费者体验上。因此,LLM 被调整为回答问题或遵循人类提供的指令。指令调整指导模型的数据集很大一部分可以为人类编写的问题和指令提供更有用的答案,面向 ChatGPT、Claude、Gemini 等等。


但智能体工作负载不同,人工智能软件不是直接为消费者生成响应,而是应该在迭代工作流程中:



主要模型制造商也越来越多地优化用于 AI 智能体的模型。


以工具使用(或函数调用)为例。如果 LLM 被问及当前天气,它将无法从训练数据中获取所需的信息。相反,它可能会生成 API 调用请求以获取该信息。甚至在 GPT-4 原生支持函数调用之前,应用程序开发人员就已经使用 LLM 来生成函数调用,通过编写更复杂的提示来告诉 LLM 哪些函数可用,然后让 LLM 生成用于确定是否要调用函数的字符串。


在 GPT-4 之后,生成此类调用变得更加可靠,然后许多其他模型本身就支持函数调用。如今,LLM 可以决定调用函数来搜索信息以进行检索增强生成 (RAG)、执行代码、发送电子邮件、在线下订单等等。


最近,Anthropic 推出了升级版的 Claude 3.5 Sonnet,能像人一样使用计算机。这意味着 LLM 原生使用计算机方向向前迈出了一大步,将帮助许多开发人员。一些团队还致力于让 LLM 使用计算机构建新一代 RPA(机器人流程自动化)应用程序。


随着智能体工作流程的成熟,我看到的是:



大多数 LLM 都针对回答问题进行了优化,主要是为了提供良好的消费者体验,我们已经能够将它们「移植」到复杂的智能体工作流程中,以构建有价值的应用程序。为支持智能体中的特定操作而构建 LLM 的趋势将为智能体性能带来很大提升。我相信,在未来几年内,在这个方向上将实现巨大的智能体能力提升。


原文链接:

https://www.deeplearning.ai/the-batch/issue-275/


© THE END 

转载请联系本公众号获得授权

投稿或寻求报道:liyazhou@jiqizhixin.com

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

大型语言模型 智能体 LLM优化 函数调用 人工智能
相关文章