智源社区 22小时前
为什么 AI Agents 按结果定价这么难?
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

文章探讨了AI Agents基于成果的定价模式,认为短期内实现这一模式面临技术、组织和文化基础设施的缺失。核心难点在于成果的归因、衡量可行性、信任赤字、组织结构以及市场结构等问题。尽管如此,基于成果的定价是AI Agents未来可持续发展的必然方向。文章提出,短期内应采用混合定价模式,并从Agents指标、透明度、狭窄用例和基础设施建设等方面入手,逐步构建实现成果定价的基础。这需要一个长期的、务实的演进过程。

📊 **归因难题阻碍成果定价**:在AI Agents的开发过程中,成果的归因极其复杂。当AI Agent、人类开发者、改进的流程和市场时机都可能影响最终结果时,难以准确分配功劳,使得基于结果的定价变得不切实际。缺乏历史数据、区分因果与相关性以及追踪跨时间价值链的技术基础设施是主要挑战。

⚖️ **成果衡量与博弈风险**:成果的展现时间尺度多样,从即时性到长期价值,供应商难以等待数月甚至数年获得报酬。此外,许多有价值的成果(如代码质量、团队士气)难以客观衡量,容易导致关注易衡量但次要的成果。一旦开始衡量并定价,可能引发团队为被衡量的结果优化而牺牲其他价值,甚至人为限制基准性能。

🤝 **信任赤字与组织抗体**:成果定价需要用户分享敏感数据,供应商核实成果,这带来了巨大的安全和隐私风险。此外,企业采购部门习惯于固定成本,对基于不确定结果的可变定价存在阻力,预算、审批和风险规避均是难题。当前的会计系统和企业文化也难以适应成果定价带来的收入确认和应计挑战。

📈 **市场结构与基础设施锁定**:少数AI供应商服务海量用户,难以提供个性化成果协议,标准化成果定价也不可能。当前的账单、CRM和ERP系统均基于订阅或使用量模式,实施成果跟踪的转换成本极高。竞争动态也使得先行者可能处于劣势,需要时间来构建和调整。

🛤️ **务实路径:混合模式与渐进演进**:鉴于当前限制,纯粹的成果定价仍是“海市蜃楼”。现实的道路是混合模式,初期以订阅/使用量为主,逐步引入易于衡量的成果定价,并随着归因系统成熟而调整比例。务实的步骤包括从Agents指标开始、通过透明度建立信任、专注于狭窄用例以及投资基础设施建设。

「短期内,纯粹基于成果的 AI Agents 定价模式只能是一座海市蜃楼。并不是因为这个概念本身存在缺陷,而是因为支持它的技术、组织和文化基础设施都还不存在。」

按照 Agent 产出的结果来付费,是当下大家热议的一个话题。此前,我们也在一篇文章中探讨过适合 AI 产品的付费模式应该是怎么样的。文中提到的一家自动化销售公司 Outreach 提倡让 AI Agent 的公司像付薪水给员工一样,为 Agent 产出的结果付费。

但 AI Agents 按结果定价付费这事短期内好实现吗?难点在哪?Substack 的一名博主写了一篇文章,探讨了为什么按结果定价在短期内很难实现,以及卡点在哪。

以下为文章全文,Founder Park 进行了编译。

原文链接:https://substack.com/home/post/p-169545293

超 10000 人的「AI 产品市集」社群!不错过每一款有价值的 AI 应用。

邀请从业者、开发人员和创业者,飞书扫码加群: 
进群后,你有机会得到:

    最新、最值得关注的 AI 新品资讯; 

    不定期赠送热门新品的邀请码、会员码;

    最精准的AI产品曝光渠道


正如我在《The Agentic Web 》一文中所说的, AI Agents 正在席卷整个互联网。

然而,还有一个现实是:在未来十年, AI Agents 也将成为关键的软件参与者。这意味着它们正在吞噬 SaaS 模式,并将它转变为截然不同的东西。

传统意义上的 SaaS 模式,从定义上讲,是垂直的、范围狭窄的,以提高生产力为基础。而 AI Agents 作为一种软件范式, 将是横向的、端到端的,以实现成果为核心。

由此,衍生出一个极具吸引力的愿景: AI Agents 根据它创造的价值收费,而不是它消耗的资源。

听起来很简单,对吧?但就目前而言,事情并非如此。

理论上,假设你支付 15,000 美元购买一个 AI Agents,它能帮助你将产品交付速度提提升 50%,为你节省 100,000 美元的工程成本。

这似乎是一个双赢的局面,供应商获得了合理的价值回报,用户看到了明确的投资回报率,整个生态系统也变得可持续发展。

但一个令人不安的事实是:短期内,纯粹基于成果的 AI Agents 定价模式只是一座海市蜃楼。

这并不是因为这个概念本身存在缺陷,而是因为实现它所需的技术、组织和文化基础设施目前还不存在。

这正是一个真正的业务转型挑战,涉及到实现这一目标所需的技术和组织要求。


01 

归因难题

设想一个真实场景:你的团队使用 AI Agents 开发一个新功能。该功能提前三周发布,带来了 200 万美元的额外收入,并将错误率降低了 40%。

这份功劳,该如何分配?

    AI Agents 的自主编码能力?

    指导和优化 AI 输出的人类开发者?

    整合了 AI 辅助、经过改良的开发流程?

    知道 AI 将负责实现需求,从而更好地定义需求的产品经理?

    使提前发布变得有价值的市场时机?

这并不是理论上的假设。

不解决归因问题,基于结果的定价是不可能的。

在一个具有多个变量、人机协作和间接影响的复杂系统中进行归因,是一个让信用评分看起来都简单的问题。

技术幻想

构建归因系统需要:

    基准确立如果没有 AI,团队的交付速度会有多快?这需要历史数据,但大多数公司要么没有这些数据,或者随着团队围绕 AI 能力进行重组,这些数据也变得无关紧要。

    因果关系与相关性是 AI Agents 导致了交付速度的加快,还是团队使用新工具的热情提高了生产力?区分这些影响需要对照实验,但在真实的商业环境中,这是不切实际的。

    价值链追踪当 AI 帮助创建一个功能,而该功能在六个月后促成了一笔销售时,你如何追踪这种联系?能够跨时间和系统维持这些因果链的技术基础设施并不存在

02 

衡量的不可行性

即使我们解决了归因问题,衡量成果也面临着根本性的挑战:

时间问题

成果在不同的时间尺度上展现:

    即时性成果:编写代码、修复错误(几小时到几天)

    短期成果:发布功能、提高生产力(几周到几个月)

    长期成果:产生收入、改善市场地位(几个月到几年)

供应商应该为创造的价值等待数月甚至数年才能获得报酬吗?除大型公司外,这种现金流影响对其他所有公司来说都是难以承受的。

主观性陷阱

许多有价值的成果难以客观衡量:

    如何为「改进的代码质量」定价?

    「因减少单调工作而提升的团队士气」的价值是多少?

    「加快初级开发者的学习曲线」值多少钱?

AI Agents 最具变革性的影响往往是最难量化的,这就导致了人们倾向于关注那些易于衡量但可能不太重要的成果。

博弈风险

一旦你开始衡量并为特定成果定价,行为就会发生变化。团队可能会:

    为了被衡量的结果而优化,牺牲了未被衡量的价值

    人为地限制基准性能,以显示更大的改进

    专注于快速见效的成果,而不是可持续的转型

我们以前在关键绩效指标(KPIs)和目标与关键成果法(OKRs)上已经见过了这种情况。加入财务激励只会加剧这种功能失调。

03 

信任赤字

基于成果的定价需要供应商和用户之间建立前所未有的信任:

用户必须分享敏感的业务指标,包括收入、成本和绩效数据。大多数将这些数据视为严密保护的竞争情报的公司,不会突然向 AI 供应商敞开他们的账本。

供应商需要核实声称的成果。这意味着访问客户的系统、审查代码以及分析业务结果。其安全和隐私方面的影响是惊人的。

当供应商和用户在成果达成或归因上存在分歧时,由谁来裁决?关于 AI 驱动的成果争议的法律框架尚未存在。当前的合同几乎无法处理服务等级协议(SLA)的违约问题,而成果归因争议则会复杂得多,呈指数级增长。

04 

组织抗体

大多数组织在结构上无法实施基于成果的定价:

采购阻力

企业采购部门的建立是为了协商固定成本、批量折扣和可预测的支出。告诉他们要批准基于不确定的未来结果的可变定价,会触发各种组织抗体:

    预算不确定性:「我们无法为未知的结果费用做预算」

    审批复杂性:「谁来批准一项可能无限的开支?」

    风险规避:「如果 AI 创造的价值超出了我们的支付能力,怎么办?」

会计难题

当前的会计系统假定软件成本是可预测的。基于成果的定价带来了:

    收入确认问题:你何时入账这笔费用——当 AI 被使用时还是当结果实现时?

    应计挑战:如何为潜在的成果费用计提应计款项?

    审计复杂性:外部审计师缺乏验证 AI 成果声明的框架

文化错位

几十年来一直致力于优化成本削减的组织,无法突然转向价值共享的思维模式。

那些为成功压低供应商价格而欢呼的财务团队,会抵制在供应商创造更多价值时支付更多费用。这种零和思维深深植根于企业文化之中。


05 

市场结构问题

当前的 AI 市场结构阻碍了基于成果的定价:

权力失衡

少数几家 AI 供应商(OpenAI、Anthropic、谷歌)为数百万用户提供服务。协商个性化的成果协议无法规模化。

跨越不同用例和行业的标准化结果定价是不可能的。

结果是,供应商默认采用他们可以统一实施的基于使用量的定价。

竞争动态

率先采用成果定价的企业面临劣势:

    与简单的订阅定价相比,处于竞争劣势

    在成果定价成为标准之前,先行者会遭受损失,而快速追随者则会受益。

基础设施锁定

当前的账单、客户关系管理(CRM)和企业资源规划(ERP)系统都基于订阅或使用量模式。实施成果跟踪需要:

转换成本极高,造成了巨大的惯性。


06 

混合现实

鉴于这些限制,纯基于成果的定价仍然是一座「海市蜃楼」。

现实的前进道路是混合模式,逐步引入成果成分:

    第 1-2 年:80%为订阅/使用量定价,20%为易于衡量的成果定价

    第 3-5 年:随着归因系统的成熟,比例变为 60/40

    第 5-10 年:对于已建立的合作关系,有可能转向以成果为主要基础的定价

但即使这种渐进式转变也面临阻力:

复杂性成本

混合模式本质上比纯模式更复杂:

    多种定价成分让买家感到困惑

    谈判变得多维度

    财务规划需要情景建模

    关系管理更加复杂

这种复杂性成本减缓了采用速度,并有利于维持现状。

先行者困境

早期采用混合模式的企业面临:

    向持怀疑态度的市场进行教育的成本

    构建新系统的运营开销

    与简单定价相比的竞争劣势

    市场尚未准备好而过于超前的风险


07 

前进道路:务实的步骤

尽管存在这些挑战,但来自费率限制和供应约束的压力使得定价演变不可避免。务实的道路是:

1. 从 Agents 指标开始

不采用真正的成果指标,而是基于可衡量的 Agents 指标定价:

    自主生成的代码行数

    使用 AI 辅助发布的功能数量

    在特定任务上节省的时间

    在 AI 帮助下解决的工单数量

这些并不完美,但它们是可衡量的,并且方向是正确的。

2. 通过透明度建立信任

在结果定价之前,通过以下方式建立信任:

    分享跨客户的汇总成果数据

    公布价值计算方法

    制定 AI 影响的行业基准

    提供具有追溯定价的试用期

3. 专注于狭窄的用例

在受限的环境中开始成果定价:

    具有明确基准的特定、重复性任务

    数据共享更容易的内部工具

    没有历史比较的全新项目

    具有既定成果指标的行业

4. 投资基础设施

构建技术和组织基础:

    集成到 AI 平台中的结果跟踪

    通过使用不断完善的归因模型

    迭代开发的法律框架

    逐步调整的财务系统


08 

关键见解:成果定价,一场持久战

基于成果的 AI Agents 定价愿景是正确的,它是唯一能协调激励机制并实现真正价值创造的可持续模式。但从现在到实现这一愿景的道路,比大多数人意识到的更长、更复杂。

短期现实是,基于成果的定价之所以是海市蜃楼,并不是因为它是错误的,而是因为我们缺乏实施它的基础设施。技术归因系统、组织准备度、市场结构和文化转变都需要时间来发展。

急于实施纯成果定价的公司将会发现,就像 Claude Code 的费率限制已经揭示的那样:理论上的优雅在实际约束面前不堪一击。赢家将是那些承认这一现实,并从当前模式向未来可能性搭建务实桥梁的公司。

这种转变是不可避免的,但时间表并不是如此。在愿景与现实之间的差距中,我们需要付出艰苦的努力来构建技术、组织和文化层面的基础设施,使基于成果的定价成为可能。

就目前而言,它仍然是一座海市蜃楼,在地平线上闪烁,吸引着我们前进,但当我们试图过快抓住它时,它就会消散。关键不是放弃这段旅程,而是认识到它比我们希望的更长,并做好相应的准备。

更多阅读

Gamma 创始人:小团队创业是共识,怎么做好才是最大的问题

别听模型厂商的,Prompt 不是功能,是 bug

YC 2025 407 家创企复盘:B2B 模式占主导,AI 编程过度饱和,最大的机会还没人注意到

上市首日暴涨 250%,All in AI 战略,拆解 Figma 的核心竞争力到底是什么?

转载原创文章请添加微信:founderparker

内容中包含的图片若涉及版权问题,请及时与我们联系删除

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

AI Agents 成果定价 SaaS模式 商业模式 技术基础设施
相关文章