Claude4的表现让我有点失望。。。

"你有没有这样一种感觉：AI越更新，可真正让你眼前一亮的，反而越来越少了？"

今天一早，Claude 4发布，我的朋友圈又被刷屏了，新功能和参数升级太炸裂了...

不过，说实话，我对 Claude4 的表现有点失望。

不是说它没有什么更新，而是我亲自实测后发现：在内容创作场景里，Claude 4 和之前相比，几乎没啥优化。

AI 模型都进化这么快了，为什么 Claude 反而给我的感觉是「倒退」了呢？

而且，最让我震撼的是，当我用同样的任务测试之前的GPT-4.1，结果直接把我惊艳到了。

它写出的内容，不仅比我平时自己写得好，甚至让我有种“表达力被AI拉升到新高度”的感觉。

我知道，工具永远只是工具，核心问题始终是：能不能解决我眼下的真实难题？

所以我没去看这些新闻，而是挑了一个我最常用的实际写作场景来做对比测试。

我每天大量产出公众号文章和课程内容，过程中最常用到的一个 AI 场景是「AI 风格化写作」。

简单理解就是，我写作时通常会先快速完成一个草稿，内容可能零碎，逻辑未必清晰，文风也不够好。

这时候我会用 AI 帮我重新优化表达，让它变得更流畅，重点是像是我自己写的，没有 AI 味。

核心方法论其实很简单：

让 AI 写出符合你预期的内容 = AI 模型能力 + 你提供的信息量 + 你给 AI 的文风特点。

现在，Claude 4 来了，我决定把「信息量」和「风格描述」固定不变，纯粹对比不同模型（Claude 4 Sonnet、Opus、GPT-4.1、Grok 3 等）在真实场景下的表现。

为了更直观，我用了 Monica，可以在同一界面自由切换不同模型、保持上下文统一，更高效地测试。

测试结果让我挺意外的。

四大模型实测对比

用什么来测试呢？

我前两天不是用 Flowith 的 Agent Neo 帮我看了谷歌的 I/O 大会，不仅给我生成了一篇简报，还帮我写了一篇公众号文章，但是这个文章的 AI 味比较浓，完全不像是我写的，于是我就拿那篇文章来做测试。

这次测试让我最大的感受是：AI 模型越来越强，但各家擅长的“气质”和风格，其实越来越分明。

Claude 4 系列（无论 Sonnet 还是 Opus）逻辑组织能力确实大幅提升，信息梳理、结构总结一气呵成，比上一代的 Claude 3.7 要好不少。

但细读后，我心里咯噔一下： “怎么有种官方通稿的味道？我的个性化表达和情绪呢？”

Claude 4 写得很顺，但一看就是“标准答案”，我想表达的那些小情绪、小细节，全被它“优化”没了，内容越写越像公关稿，粉丝根本记不住我是谁。

原本 Claude 系列擅长文科表达，但新版本却变得更加理性、标准，甚至有点机械了，这也是我失望的原因。

切换到 GPT-4.1，重新生成，我一下子就感觉到差别：

“去年大家还在炫肌肉，今年谷歌直接把 AI「注入灵魂」……”

“AI 的用量暴涨 50 倍，这不叫风口，叫海啸。”

它写出来的段落，不仅信息不丢失，而且有一种我平时很难自己写出来的“高阶表达感”。

不仅保持了我的原意，还直接拔高了表达，让文字更有力量、更有感染力，我平时根本写不出这样的高阶表达，但靠 GPT-4.1，我轻松做到了。

再试 Grok 3，整体看起来最像我的日常表达，口语化、朋友聊天般自然，但没有任何突破。

最多只是帮我发挥到自己平时最高的水平，而不像 GPT-4.1，能超越我的上限，让我的表达上了一个新台阶。

总结一下：

• Claude 4 变得太规矩、少了灵动；• GPT-4.1 更懂「风格拔高」，给我惊艳的表达体验；• Grok 3 只是维持我的常规水平。

AI 和人之间的协作逻辑变得越来越有层次，原本 2023 年大家还在说“ChatGPT 像理科生，Claude 像文科生”。

但现在看，Claude 4 越来越理工、专攻代码了，反而在写作风格这块变得“规矩、标准”，而 GPT-4.1 在表达、语感和场景共鸣上甚至可以“帮我超常发挥”。

**
**

AI写作的正确方式

这场实测让我更加确信：真正的高手从来不是让 AI 替你写，而是让 AI 帮你写得更好。

具体怎么做？你负责定基调、定方向，AI负责润色、扩写、补细节，最后你来把控整体节奏和气场。

这就像导演和演员的关系：你是导演，决定故事走向和情感基调，而AI是演员，帮你把想法演绎得更生动。

但最终呈现的作品，依然带着你的思考痕迹和个人风格。

所以别指望AI一键生成完美内容，那样写出来的东西注定平庸。

我自己的习惯是：

• 先用 AI 帮我整理素材、改写草稿，把乱七八糟的想法变成一篇“还可以”的初稿；• 然后再用 AI 反复慢改、对比不同模型的表达；• 最后所有“核心观点”“情绪共鸣”“场景金句”，还是要靠我自己补全、定调、润色。

这种协作模式的结果是什么？

结果是 AI 不仅是你的写作提效助手，更是让你表达能力“越用越强”的「写作能力放大器」。

AI 是 放大器、提效器，但你不思考、不表达，它放不出花来。

但这里有个更深层的问题：

为什么同样用 GPT-4.1，有些人写出的内容依然平庸无奇？

我在教学过程中发现，很多人拿到好工具后，第一反应是直接问 AI："帮我写一篇关于 XXX 的文章。"

结果呢？AI 确实给了你一篇文章，但这篇文章：

• 没有你的观点，只有 AI 的"标准答案"• 没有你的经历，只有 AI 的"通用案例"• 没有你的情绪，只有 AI 的"客观描述"

我见过太多人，花几个小时跟 AI"聊天"，最后得到一篇看起来很完整、实际上毫无价值的内容。因为他们不知道：

• 如何设计提示词，让 AI 理解你的真实意图？• 如何分步骤引导，而不是期待一次性完美输出？• 如何保持你的个人风格，避免千篇一律的 AI 腔调？• 如何利用不同模型的特长，组合出最佳效果？

这就是为什么，光知道"GPT-4.1 很强"还不够，你需要一套完整的协作方法。

四大模型实测对比

AI写作的正确方式

Fish AI Reader

FishAI

联系邮箱 441953276@qq.com

相关标签