PaperAgent 2024年07月05日
RouteLLM:并非所有的任务都需要GPT-4
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

RouteLLM 是一个基于偏好数据的 LLM 路由框架,旨在通过将查询路由到最合适的 LLM 来优化成本和性能。该框架利用 Chatbot Arena 数据训练了四种不同的路由器,包括相似度加权排名路由器、矩阵分解模型、BERT 分类器和因果 LLM 分类器。实验结果表明,这些路由器可以在不影响质量的情况下显着降低成本,例如在 MT Bench 上,与仅使用 GPT-4 相比,成本降低了 85% 以上,同时仍能达到 GPT-4 的 95% 的性能。

🤔 RouteLLM 是一种 LLM 路由框架,旨在根据查询的复杂性和模型的能力,将查询路由到最合适的 LLM,从而优化成本和性能。

🚀 RouteLLM 通过利用 Chatbot Arena 数据训练了四种不同的路由器,包括相似度加权排名路由器、矩阵分解模型、BERT 分类器和因果 LLM 分类器。

📊 实验结果表明,这些路由器可以在不影响质量的情况下显着降低成本,例如在 MT Bench 上,与仅使用 GPT-4 相比,成本降低了 85% 以上,同时仍能达到 GPT-4 的 95% 的性能。

📈 此外,研究表明,使用来自 MMLU 验证拆分的标准标签数据扩充训练数据集,可以显著提高所有路由器的性能,证明了即使样本数量很少,数据增强也是有效的。

2024-07-05 11:55 湖北

LLM 在一系列任务中都表现出了卓越的能力,但从图1中的性能与成本图可以看出,它们的成本和能力存在很大差异。从广义上讲,能力更强的模型往往比能力较弱的模型更昂贵。这导致在现实世界中部署LLM时出现两难境地:将所有查询路由到最大、能力最强的模型可以获得最高质量的响应,但成本可能很高,而将查询路由到较小的模型可以节省成本,但可能会导致响应质量较低。

图1:各种LLM的性能与成本图。性能由Elo在Chatbot Arena上测量,每百万token的成本假设为1:1的输入/输出比。通过两个模型之间的路由,理想情况下实现了比任何一个模型都更好的性能:成本比。

LLM最权威评估榜单维护者lmsys开源RouteLLM(LLM路由),提供了一种解决方案,其中每个查询首先由一个系统处理,该系统决定将其路由到哪个 LLM。理想情况下,所有可以由较弱模型处理的查询都应路由到这些模型,而所有其他查询则路由到较强模型,以最大限度地降低成本,同时保持响应质量。

RouteLLM是一个基于偏好数据的LLM路由原则框架。将LLM路由问题形式化,并探索增强技术以提高路由器性能。使用Chatbot Arena 的公共数据训练了四种不同的路由器,并证明它们可以在不影响质量的情况下显着降低成本,与仅使用GPT-4相比,MT Bench上的成本降低了85%以上,MMLU上的成本降低了 45%,GSM8K上的成本降低了35%,同时仍能达到GPT-4的95%的性能

在三个流行的基准上评估了这些路由器:MT Bench、MMLU和GSM8K,为了进行评估,在GPT-4 Turbo作为强模型和Mixtral 8x7B作为弱模型之间进行路由。使用之前的随机路由器作为基线。

图2:仅在Arena数据上训练的MT Bench上的路由器性能(左),在使用LLM评判员增强的Arena数据上训练的路由器性能(右)。

图3:MMLU上的路由器性能(左)仅在Arena数据上进行训练(右),该数据是在使用来自MMLU验证分割的标准标签数据增强的Arena数据上进行训练的。


lmsys还构建了一个小demo。例如,编码问题被路由到GPT-4-1106,博客写作被路由到 Mixtral-8x7b。体验地址:

https://0c83f754b05f4a2208.gradio.live/

https://github.com/lm-sys/RouteLLMhttps://arxiv.org/abs/2406.18665RouteLLM: Learning to Route LLMs with Preference Data

推荐阅读


欢迎关注我的公众号“PaperAgent”,每天一篇大模型(LLM)文章来锻炼我们的思维,简单的例子,不简单的方法,提升自己。


Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

LLM 路由 偏好数据 成本优化 性能提升
相关文章