Founder Park 02月12日
中美 AI 创业者的闭门讨论:DeepSeek-R1 之后,AI 创业的变化和新趋势
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

文章围绕DeepSeek展开讨论,涉及创新点、成本低的原因、对用户的影响、在垂直场景的应用、国产芯片与推理算力、Agent能力及跨应用调用等方面

DeepSeek的创新体现在强大的模型及推理能力,如V3基座模型、R1模型的反思能力等

成本低的原因包括模型稀疏度高、系统设计精巧及对训练框架和管线的调整等

Chatbot不一定是用户首款AI产品,DeepSeek R1结合搜索功能带来全新体验

在垂直场景中落地更容易,如处理有明确答案的任务,但存在一些局限性

国产芯片有望解决推理算力问题,DeepSeek适配华为保证稳定训推

原创 Founder Park 2025-02-11 19:15 北京

垂直领域的Agent能力会有大提升。

DeepSeek 无疑是 2025 年春节期间的焦点,从 App 登顶苹果商店免费榜、到各个云厂商争相部署 DeepSeek-R1,DeepSeek 甚至成了很多人第一次体验的 AI 产品。而对于创业者来说,从技术创新点的讨论、训练和推理成本的分析到对整个 AI 行业的影响等,大家都在聊。

2 月 2 日,Founder Park 和同为极客公园旗下的全球化闭门社区 Global Ready 组织了一场闭门讨论,邀请了硅谷、国内、伦敦、新加坡、日本等地 AI 公司的 60 余位创始人与技术专家,从技术创新、产品落地、算力紧缺等角度,对 DeepSeek 引发的技术新方向和产品趋势,进行了一场深度探讨。

在脱敏处理后,我们整理了本次闭门讨论的要点内容。

关于Global Ready :

Global Ready Community 是极客公园孵化的全球创新者社区,与世界顶尖创新者共同探索科技的无限可能。

社区会员可享受:高效链接海外 500+ 位创始人 & 技术专家 & 投资人,闭门活动入场券等权益,我们希望成为你链接世界的高效率 API。申请加入社区可以点击「原文链接」或者在我们公众号后台留言:加入 GR 社区。

想参加 Founder Park 的更多 AI 创业交流活动,可以添加我们的小助手


01 

DeepSeek 的创新在哪里?

DeepSeek 于 12 月底发布了 V3 基座模型,是业界目前开源的最强大的模型之一,包含 37B 激活参数,整体参数规模为 671B,是一个大型 MoE(混合专家)模型。

2025 年 1 月份发布的 R1 模型的「Aha moment」指的是当模型在进行推理时能够表现出一定的反思能力。例如,在解决问题过程中,模型可能会意识到某种方法不再适用,并在过程中调整为更有效的方法。这种反思能力源自强化学习(RL)。

R1 是 DeepSeek 的旗舰模型,R1 在推理能力方面与 OpenAI o1 相当,具体的实现方法可以总结为:R1 通过两步强化学习和两步 SFT,前两步的 RL 和 SFT 主要用于构建一个数据生成的教师模型,去指导第三步的数据生成。这个模型致力于成为目前最强大的推理模型。


02 

为什么 DeepSeek 的成本这么低?


03 

Chatbot 不一定

会是用户的第一款 AI 产品


04 

垂直场景 AI 落地更容易了


05 

国产芯片有望解决推理算力问题


06 

更强大的 Agent 、

以及跨应用调用能力




更多阅读

Lex Fridman 五小时聊 DeepSeek:一文看懂 DeepSeek 的创新与2025 AI 趋势

拾象科技李广密:对 DeepSeek 和智能下半场的几条判断

台积电张忠谋万字访谈:如何拿下黄仁勋、苹果和高通,成为全球最大芯片代工厂?

SemiAnalysis万字解析DeepSeek:训练成本、技术创新点、以及对封闭模型的影响


转载原创文章请添加微信:founderparker

阅读原文

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

DeepSeek AI 推理能力 成本控制 垂直场景
相关文章