36氪 - 科技频道 07月30日 20:20
不融资、无销售,却爆赚10亿美金,这家华人公司,估值1000亿
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

Surge AI,一家由华人创始人Edwin Chen于2020年创立的公司,凭借其独特的“不融资、无销售”模式,在AI数据服务领域异军突起。仅凭120人团队,年收入已超10亿美元,盈利能力甚至超越了规模庞大的Scale AI。Surge AI以“隐私优先、安全第一”为核心,专注于提供高质量、高精度的AI训练数据,尤其在RLHF(人类反馈强化学习)和数据合规性方面表现突出。通过构建精英标注网络和自研动态标注引擎,Surge AI能够满足医疗、政府等敏感领域对数据隔离和准确性的严苛要求,赢得了OpenAI、Anthropic、Google等众多明星公司的信赖,成为AI数据竞赛中的关键玩家。

🌟 **独特商业模式与卓越盈利能力**:Surge AI成立以来坚持不融资、不设销售团队,仅靠创始人2500万美元启动资金和口碑传播,便实现了年收入超10亿美元的惊人成绩。其120人的团队规模远小于竞争对手Scale AI(1200人,年收入8.5亿美元),但盈利效率更高,这得益于其对产品价值的专注和对客户需求的精准把握,从第一月起就实现盈利,并依靠高质量数据赢得客户的长期合作。

🔒 **安全合规与隐私优先的承诺**:Surge AI将“隐私优先、安全第一”作为公司运营的基石,其工作流完全符合SOC II认证等合规要求,能够满足医疗、政府等领域客户对数据全链路“物理隔离”的严格需求。这种对数据安全和隐私的高度重视,使其与Anthropic等重视AI伦理和数据治理的机构建立了天然的契合,成为其首选数据供应商。

🚀 **高质量数据驱动AI模型突破**:在当前AI大模型发展瓶颈在于数据质量的背景下,Surge AI通过砍掉低质流水线,构建了“Surge Force”精英标注网络,严格筛选具备专业背景(如STEM学位)的标注人员,并进行严格的试写审核。这种近乎苛刻的标准,确保了其交付的数据质量远超普通供应商,甚至能让模型在真实世界的问题解决能力上取得显著提升,例如其数据质量能让模型写得像人、想得像人。

💡 **技术创新与极致质控**:Surge AI不仅在人才筛选上追求极致,还在技术层面进行了创新。其自研的动态标注引擎能够理解黑话、抓住meme文化内涵,并能精准判断情绪。同时,其独创的“小数点后”级质控技术,通过背靠背标注、多轮仲裁和AI辅助校验,实现了99.99%的准确率,超越了Scale AI的98%准确率。在RLHF方面,Surge AI提供的偏好排序、奖励建模和红队攻击服务,显著提升了大模型的性能,如帮助Claude实现了性能突破。

🌐 **中立定位与战略价值**:在AI行业竞争日益激烈的格局中,Surge AI的中立性定位使其获得了独特的战略优势。当Meta等巨头投资Scale AI时,OpenAI、Google等公司对数据被竞争对手经手产生担忧,转而将订单大规模转向Surge AI。这种中立性成为其2024年收入反超Scale AI的重要催化剂,使其在AGI竞赛中掌握了人类反馈数据这一核心命脉。

这可能是整个AI圈最低调、也最赚钱的独角兽。

它没有融资,没有销售团队,也没有市场公关部门,却悄悄成了服务OpenAI、Anthropic、Google等一众明星公司。

它就是Surge AI。

Surge AI成立于2020年,创始人是一位华人面孔——Edwin Chen,麻省理工毕业,曾在华尔街对冲基金、Google、Facebook做算法,一路走到AI最前线。32岁那年,他选择亲自下场创业。

如今,Surge AI的赚钱效率比大热的Scale AI还高。

团队规模超1200人的Scale AI,年收入为8.5亿美元。而Surge AI只靠120人的团队,就把年收入做到了超过10亿美元。

据路透社报道,SurgeAI正启动首轮融资,目标募资10亿美元,估值或达150亿美元(约合1000亿元人民币)。

不出意外,我们又将见证一家AI领域千亿公司的诞生。

不融资、无销售,靠120人做到10亿美金

毫不夸张的说,在AI创业圈,Surge AI是个难得的“异类”。

从创业伊始,创始人Edwin Chen就做了一个“反硅谷”的决定:不要VC的钱

▲Surge AI 创始人Edwin Chen(来源:Inc.com)

整个公司成立之初,只靠他自己拿出的2500万美元自力运营。

不仅如此,在成立很长一段时间里,公司连一个专职销售都没有,增长完全靠“自来水”传播。

第一个客户,来自Edwin的人脉圈。当这个实验室拿到数据后,发现质量远超市面所有供应商,于是很快推荐给了同行。

就这样,一家无融资、无销售的小公司,靠数据质量打动了OpenAI,随后是Anthropic、Google、Microsoft……十传百,成了AI圈“只推荐、不吆喝”的标注底座。

Surge AI团队规模很小年收入超过10亿美元团队规模才只有120人

作为对比,Scale AI团队规模高达1200人,是Surge AI的十倍,年收入却为8.5亿美元,没能赢过SurgeAI

为什么Surge AI会选择这种“慢”模式?

Edwin Chen的观点很直接:“创业不该是一个地位游戏。”

他是MVP(最小可用产品)理念的坚定信仰者。他认为,90%的创业者在还没搞清产品有没有价值前,就已经在朋友圈吹牛说自己融资千万,登上TechCrunch头条。但这对用户没有半点意义。

而Surge AI从第一个月开始就盈利,不需要钱,更不希望销售去“推”产品。他们要的是客户因为真正理解高质量数据的价值,才决定长期合作。

没有了增长的压力,Surge AI从第一天开始就围绕“隐私优先、安全第一”构建,不用为资本扩张让步,也不用为利润最大化牺牲客户数据

在医疗、政府等领域,客户要求数据全链路“物理隔离”,Surge AI的工作流——SOC II认证、专家专属标注通道,完全符合合规要求。

这套高度定制、零妥协的体系,也和Anthropic等“安全主义”实验室天然对路。如今,它已成为这些最重视AI伦理与数据治理机构的首选供应商。

当然,Surge AI能赢下AI数据之战不仅靠的是安全合规,还有其建立的高质量数据体系。

SurgeAI如何赢下数据之战?

大模型发展到了如今的阶段,模型能力的边界,往往不是卡在参数量上,而是卡在数据质量上。

很多人以为合成数据是万能的。它确实有用,但有个致命缺陷:合成数据只能让模型擅长解决“合成问题”,却解决不了真实世界的问题。

现在很多模型都是这样,基准测试成绩漂亮得不得了,可一落到实际场景,就漏洞百出。

越来越多公司找上Surge AI,说他们花了一年时间用合成数据训练模型,结果全错了。现在不得不花好几个月去清理那些废数据。

想让模型写得像人、想得像人、判断得像人,必须喂它真正像人一样看世界的数据。以前那种“AI包工头”模式早就跟不上了。靠人海战术堆数据,已经没法让模型学到真本事。

Surge AI很早看清楚了这个趋势,比谁都快地完成了这场转型。

它砍掉了低质流水线,转而搭建起一个叫“Surge Force”的精英网络

看上去好像就是一个数据标注的活,但这可不是什么人都能干的。毫不夸张的说,想进这个网络,比申请常春藤还难

比如,OpenAI著名的数学数据集GSM8K,Surge会优先选择具备数学或STEM学位的标注员,如来自MIT等藤校的大学生。

有了专业背景还不够,所有标注员还需提交5道试写题目,经另一名资深标注员审核通过后才可加入团队。

之所以要求这么高,想要让模型真正搞懂一件事情,必须靠专业的人来完成。所以,Surge AI请了很多律师、教师、工程师、多语种专家…来干这些“脏活累活”。

就是这种近乎苛刻的标准,让Surge AI的数据质量一直稳得可怕。很多客户说,Surge AI交付的几千条人工数据,比他们之前买到的上百万条合成数据更有价值。

除了招揽更多的专业人才,Surge AI在技术层面也做了创新。

SurgeAI自研了一套动态标注引擎。它能读懂黑话、抓住meme背后的文化内涵,甚至对就像遇到“how dare you!”这样的句子,它也能分清这是愤怒、调侃还是夸张。

不仅看得准,还查得严。Surge AI独创“小数点后”级质控技术,准确率比Scale AI(98%)还要高。

Surge AI通过背靠背标注、多轮仲裁、AI辅助校验,锁定99.99%准确率。某企业旧NLP数据集经Surge AI重标,文本分类准确率显著提升,效果远超普通优化。

RLHF(人类反馈强化学习)是让大模型“懂人话”的关键步骤。Surge AI在这方面也走得比别人更远。

它不光能做偏好排序、奖励建模,还能安排红队攻击,专门喂给模型一些“刁钻”数据,逼它长记性。Anthropic团队就说过,SurgeAI的数据质控和RLHF工具,直接让Claude的性能实现了突破。

除了数据质量高外,Surge AI效率还出奇的高。

据了解,某客户一次下了5000条多轮情感标注任务,按200条一批发给Surge AI。结果第一批不仅按时交付,而且质量超标,于是Surge AI顺理成章地接下了后续合作。

总结

总的来说,SurgeAI的爆发,并非偶然。它踩中了四个关键趋势:

首先是卡位高质量数据刚需

RLHF火了,高质量人类反馈变成模型性能的“命门”。客户说得更直白:“没Surge AI的数据,我们根本构不出现在的模型。”

其次,Sugre AI的技术质量为其建立起高壁垒定价权

精英网络与99.99%质量目标构建极高壁垒,客户对“小数点后精度”的刚性需求(AI安全容错率极低)赋予强议价能力。

第三,Surge AI的商业模式也有着高利润可复制

其深度嵌入客户训练管道后,产生持续性、高粘性重复收入——数据是持续消耗品。

最后,中立性定位为它在行业格局中也抢到了一席之地。

Meta重资押注Scale AI,直接引发OpenAI、Google等对“数据经手竞争对手”的担忧,订单大规模转向中立替代方Surge AI,成为其2024年收入反超Scale AI的爆点催化剂。

在AGI的终极竞赛中,真正能影响AI价值观的,不是模型架构,而是谁掌握了人类反馈的数据命脉。而SurgeAI,就是那个掌握AI命脉的玩家。

本文来自微信公众号“乌鸦智能说”,作者:智能乌鸦,36氪经授权发布。

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

Surge AI AI数据 高质量标注 RLHF 数据安全
相关文章