DeepSeek R1怎么用?七大真实使用场景评测_哔哩哔哩_bilibili
DeepSeek R1跑分确实很强,接近甚至超越OpenAI o1水平了。但,我们也看到太多次评测指标一流,但实际使用体验完全不是那么回事的产品了。
尤其是,推理模型在数理方面的能力大多数人平时压根用不上。所以,R1在实际执行我们普通人日常的任务上究竟怎么样?
带着这样的问题,我用DeepSeek做了信息收集、信息总结、翻译、写作、问答等七个不同场景的评测,去看看它在常规任务下的表现。
R1在使用上最值得关注的几个特点是:
1、R1是个推理模型,所以相比在使用deepseek v3或GPT-4o等普通模型时,我们可能需要通过要求模型扮演专家、一步步思考、少示例提示等提示词技巧去提升模型表现,在使用推理模型时,我们最好的策略是别用技巧,直接表达我们的需求。
2、R1是目前唯一一个可以联网搜索的推理模型,像OpenAI的o1、Google的gemini 2.0 flash thinking都是不支持联网的,所以它在需要信息收集和需要收集实时信息进行加工(比如写作)的场景下表现非常出色,可以替代Perplexity以及带搜索功能的GPT4o
3、R1目前完整展现出来的思维链非常出色,从用大模型学习的视角来说,思维链的过程比现在R1所呈现的结果甚至更值得学习,是一个让你学会如何思考这项元能力的feature。