孔某人的低维认知 02月24日
你以为能PMF的 可能并不PMF
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

文章作者通过对两位非LLM高级功能用户的体验观察,反思了OpenAI Deep Research (ODR) 的用户接受度问题。作者原本预期 ODR 会让用户感到“震惊”,但实际反馈却远低于预期。对比其他竞品,用户对ODR的评价尚可,但距离真正的PMF(Product-Market Fit)似乎仍有差距。作者认为,可能是过去两年“烂LLM”拉低了业内人士的心理预期,而普通用户的标准更高。文章由此引申,指出许多开源或闭源的Deep Research复刻项目,可能因脱离用户需求而沦为“粪球”。最后,作者呼吁业界重视PMF的缺失,并开放交流与合作。

💡用户体验落差:作者发现,非LLM高级功能用户对OpenAI Deep Research (ODR) 的评价并未达到预期的“震惊”效果,实际体验与业内人士的预期存在落差。

🔍竞品对比分析:通过对比Grok3 DeepSearch、Gemini Deep Research、Kimi深度探索版、ChatGPT 4o的搜索以及豆包的学术搜索,用户认为Grok3尚可,其他产品表现不佳,突显了ODR在同类产品中的相对优势,但也暴露了其改进空间。

🎯PMF的反思:作者认为,许多人之前以为的PMF可能根本就没到PMF,ODR这种水平的质量才是第一个PMF。这暗示了当前LLM产品普遍缺乏真正的用户需求匹配,许多项目可能在“玩粪球”。

原创 孔某人 2025-02-22 09:00 北京

我们原以为OpenAI Deep Research有80分,但实际在用户看来可能才刚满60分。

小短文一篇,发一个感慨。

连续线下给两个不太用LLM高级功能的用户演示OpenAI Deep Research(以下简称ODR)。

他们对于ODR的感受都是,这挺好的,后面准备去用,达到PMF。

第二个人我还给他演示了Grok3 DeepSearch、Gemini Deep Research、kimi的深度探索版、ChatGPT 4o的搜索、豆包的学术搜索。英文prompt和搜索目标也是英文圈(没有Grok3 DeepSearch检索中文不好的问题)。对其他这几个评价是:Grok3还能看,其他是垃圾。

我不知道读者是怎么评价ODR的。但一般LLM相关领域的人在给别人展示ODR的时候期待的反馈是“震惊”,我也是这么觉得和期待的。但实际上很难让圈外人觉得震惊/惊讶/aha。


可能我们都过于习惯过去2年的“烂LLM”和烂产品了,这可能拉低了我们的心理预期,但普通用户的心理预期并非这样。很多人之前以为的PMF可能根本就没到PMF。

ODR这种水平的质量才是第一个PMF的,这有多少人才能预判?由此来看R1才开始的爆火,别有一番不同的意义。


以这个标准,去开发或者玩那些开源复刻DeepResearch的项目,基本是在玩粪球,闭源产品很多也是在玩粪球。远远脱离了用户需求。

其他细分赛道的产品状态难道会比Deep Research明显好么?

缺乏PMF的产品,单纯只是因为产品太烂,而我们没有注意到这点。


交流与合作

如果希望和我交流讨论,或参与相关的讨论群,或者建立合作,请加微信,联系方式请点击 -> 联系方式

本文于2025.2.22首发于微信公众号

阅读原文

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

OpenAI Deep Research 用户体验 PMF LLM 产品反思
相关文章