dbaplus社群 03月03日
尊敬的 IT 部门,请停止尝试构建自己的 RAG
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

本文作者Alden Do Rosario指出,许多IT部门试图自研RAG聊天系统,却忽视了其复杂性和高成本。文章拆解了自研RAG的陷阱,包括预处理复杂度、准确率问题、安全漏洞以及持续运维的挑战。同时,文章还强调了自研RAG所需的多方面专业能力,如ML运维、RAG专项技能、基础设施知识和安全专长。作者建议企业应聚焦业务问题,选择可靠的RAG供应商,并将工程资源投入到真正差异化的领域,而非重复造轮子。

⚠️自研RAG看似简单,实则暗藏陷阱。文档预处理、准确率暴跌、幻觉问题、安全漏洞等,每一项都可能拖垮项目进度,导致预算超支和工程师精疲力尽。

💰自研RAG的真实成本远超想象。除了基础设施和人力成本,还包括持续运维、安全更新、模型升级、数据清洗等,这些都需要长期投入大量资源。

🛡️自研RAG面临严峻的安全挑战。敏感信息泄露、提示词注入攻击、内部数据暴露等风险,需要持续的安全更新和防护措施,以应对不断进化的威胁。

🚀选择可靠的RAG供应商是更明智的选择。他们提供基础设施管理、企业级功能、专家支持和运维优势,能帮助企业更快上市、降低总成本、控制风险。

原创 Alden Do Rosario 2025-03-03 07:15 广东

五年后,没人关心RAG是自研还是采购,他们只在乎痛点是否解决……


你们绝对不会花一百万年时间自建CRM系统或定制CMS——在大多数情况下,也不会自研大语言模型(LLM)。对吧?


但如今放眼望去,我看到无数IT部门正自我催眠,认为自建基于RAG的聊天系统"与众不同"。其实不然。甚至更糟。


上周,我目睹一群才华横溢的工程师演示他们全新的自研RAG流水线。他们自豪、兴奋——因为用上了向量嵌入!做了提示词工程!却浑然不知即将到来的灾难。


相信我,这种剧情我看过无数遍。结局总是相同:工程师精疲力尽、预算超支,以及CTO质问为何不直接购买现成方案。


一、"看似简单"的陷阱


我懂你们!你们看着RAG心想:




"向量数据库 + LLM = 大功告成!"




加上开源工具,或许再来点[Langchain]后面会细说),就完事了?


大错特错。


最近接触的一家中型企业,其"简单"的RAG项目1月启动。到3月时:



最糟的是,他们逐渐意识到:原以为两个月能搞定的项目,将变成持续噩梦。



以下是他们未考虑到的坑:



每一项都能单独成项目,处处暗藏杀机,随时拖垮进度。


二、无人提及的真实成本




"但我们有人才!有工具!开源免费!"




停。立刻停止。


让我拆解"免费"RAG系统的真实成本:


1、基础设施成本



2、人力成本



3、持续运维成本



讽刺的是:当你们烧钱自建时,竞争对手早已用现成方案投产,成本仅是零头。


为什么?


因为采购方案经过数千客户验证,研发成本已被均摊。而你们的投入,全由一家独自承担。


4、安全噩梦


想失眠?试试负责一个能访问公司全量知识库的AI系统:



某CISO发现其自研RAG系统意外泄露内部文档标题,修复耗时三周,随后又发现五处同类漏洞。


威胁进化速度远超团队应对能力。上月的防护措施今天可能已过时。攻击面持续扩大,黑产手段日益高明。


记住:每新增一份文档都是潜在风险,每条提示词都是攻击入口,每次响应都需筛查。不仅要构建安全系统——更需在日变的环境中维持安全。


5、运维恐怖片


还记得那家用Langchain起家的初创公司吗?后续剧情:



这不是个例,而是自研RAG系统的标准生命周期。更"精彩"的还在后头:


6、日常运维任务



7、周常任务



8、月常任务



所有这些都需在开发新功能、支持新用例、满足业务需求的夹缝中完成。


三、专业能力鸿沟




"但我们有顶尖工程师!"




当然。但RAG不仅是工程问题,实际需要:


1、ML运维能力



2、RAG专项技能



3、基础设施知识



4、安全专长



在当下市场,招齐这些人才已是难题。即便找到,能否负担薪资?能否留住?毕竟全行业都在抢这些人。


更关键的是:当其他RAG平台持续升级服务、提升准确率和反幻觉能力时,你们的团队能保持同步吗?未来二十年呢?


四、上市时间现实


当你们自研RAG时:




真实的自研RAG生产级系统时间表:


第1月:初始开发



第2月:现实暴击



第3月:重构阶段



第4月:企业级适配



这还是顺利的情况。实际投产时,问题只会更多!


五、采购替代方案


听着,我并非反对自研,而是建议明智选择建造内容与理由。



现代RAG解决方案提供:


1、基础设施管理



2、企业级功能



3、运维优势



4、商业价值



5、何时应该自研?


好吧,严格来说只有三种情况:


1)存在现有供应商无法满足的特殊监管要求



2)RAG是你们的核心产品



3)拥有无限时间与预算(若符合,那么请联系我!)



六、正确做法


1、聚焦真实业务问题



2、选择可靠RAG供应商



3、将工程资源投入真正差异化的领域



因为真相是:五年后,没人关心RAG是自研还是采购。他们只在乎痛点是否解决。


七、最终结论


停止重复造轮子。尤其当这个"轮子"实则是需要持续维护、细节出错就会爆炸的AI航天器。


自研RAG就像2024年自建邮件服务器——当然可以,但何必?


未来的你会感谢这个决定。工程师会感谢,预算会感谢,更重要的是:当你在凌晨三点调试准确率问题时,业务会感谢你选择了解决真实问题。


选择权在你们,但请明智选择。


作者丨Alden Do Rosario    编译丨Rio

来源丨网址:https://pub.towardsai.net/dear-it-departments-please-stop-trying-to-build-your-own-rag-4546b4638273

dbaplus社群欢迎广大技术人员投稿,投稿邮箱:editor@dbaplus.cn


阅读原文

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

RAG 自研 采购 AI安全 运维成本
相关文章