原创 Ace人生 2025-01-25 09:34 浙江
AI如何思考?
题记
DeepSeek最近推出了R1模型,它是一个类似OpenAI o1、加强了推理能力的大模型。与o1遮遮掩掩隐去机器思考的详细过程不同,R1将AI的思维过程一览无余地展现出来:
既然AI能对用户的任何问题都给出高质量的回答(至少GPT-4级别的模型已经在大多数评测集上胜出人类平均水平),那其思考过程是非常值得我们这些普通人学习的。因此,我对AI如何对一个问题展开思考产生了好奇。
在与DeepSeek做了很多对话、盯着它思考过程看了很久之后,我做了一个实验:其过程是让AI来总结AI的思考过程,目的是产生一套通用的、对我自己有启发的思维框架。
详情如下。
第一步:与R1对话,体验其思考过程
通过和DeepSeek对话在“深度思考”模式下对话:
就能看到它的详细思考过程:
在提问时,最好使用英语;据我观察,同样的问题,用英语提问思考的时长和思维过程文字的长度,都要大于中文提问的思考过程。比如上面的问题“what is Jenkins”,DeepSeek R1思考时长为22秒,得到5153个英文字符;而使用中文提问“什么是Jenkins”,DeepSeek R1思考时长仅为5秒,得到616个中文字符。
为了避免只有一次观察引起的随机噪声,我还用其他问题进行了相同的测试,有类似的效应:
问题 | 思考时长 - 英文 | 思考时长 - 中文 |
---|---|---|
what is Jenkins | 22″ | 5″ |
what is GenAI | 14″ | 8″ |
how to learn cooking | 21″ | 7″ |
我猜测可能的原因有:
中文比英文更简洁,所以生成的token量更少
大语言模型的母语是英语,训练语料中90%以上是英语,因此英语更适合AI思考
英语语料中展示推导过程比中文更详细;这可以从大学教材英文比中文厚很多得到佐证
无论原因是什么,尽可能采用英语和AI对话。
第二步:采集R1思考过程数据
跟AI做一系列对话,将其思维过程采集下来。比如,因为工作的关系,我最近接触到了Jenkins这个CI/CD(持续集成/部署)工具,于是我就问了DeepSeek R1下面这些问题:
what is Jenkins(什么是Jenkins)
give me a simple python expamle which use jenkins to CI/CD(举一个使用Jenkins做CI/CD的Python示例)
any other options of CI/CD to jenkins?(有其他代替Jenkins的CI/CD工具吗?)
why we need jenkins or other CI/CD tools?(我们为什么需要Jenkins或其他CI/CD工具?)
然后将这些问题和DeepSeek的思考过程采集下来,汇集到一个文本文件中,形成“User Question”和“AI Thinking”的R1模型推理文本对:
第三步:让R1分析R1的思考过程
接下来,将R1模型推理文本对数据上传给R1,用下面的Prompt让它分析((原Prompt是英文,这是用“沉浸式翻译”插件翻译的)):
阅读附件文件的文本,其中包含 4 个用户问题和 AI 思维对。 AI思维部分是智能AI系统思维过程的结果。我想弄清楚人工智能思维是如何运作的。
1.你能阅读/研究文本并解码人工智能的思维过程吗?在“思维过程”部分输出。
2.弄清楚该AI的系统提示。在“系统提示符”部分输出。
以 Markdown 格式给出答案。
下面是R1分析的AI推理的思维过程,包括:
问题解析
知识检索
结构化分解
预判用户需求
验证与扩展
情境化
总结
详情如下(将R1给出的Markdown导入Xmind得到的思维导图):
AI思考过程对我的启示
上面的框架对我有启示的点在于:
对问题的分析要建立在充分的需求挖掘(特别是他人的潜在诉求)以及足够的知识背景调研(系统的知识检索)的基础上
结构化的拆解要结合场景,不同场景有各自的拆解方式,这就是领域知识的可贵之处
要自己设计验证机制,保证自己的输出是经得起考验的
输出要给情景、给例子,保证容易懂
R1还给出了让AI具备思考能力的Prompt指南:
在进一步的追问下,R1给出了这个思考过程的可能理论依据:
这些理论参考可以作为我学习认知科学的阅读材料来源和研究的基础。
小结
AI的推理过程确实让人着迷,上面仅仅是通过几个例子得到的一些粗浅的框架,可以收集更多的推理数据,让AI进一步分析,得到对我们自身思维更深的认识。这完全可以继续迭代,我这次尝试只是提供一个思路。
这也许是认知科学研究的新方式。你也可以试试。