华尔街见闻 - 资讯 - undefined 01月28日
大摩:DeepSeek对中国数据中心和软件行业意味着什么?
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

开源大语言模型DeepSeek R1以远低于GPT的训练成本实现了相近的性能,引发业界广泛关注。摩根士丹利分析师报告指出,该模型的出现挑战了采用大规模高端GPU集群训练LLM的必要性。DeepSeek R1的训练成本仅为GPT的1/30,却能达到与其相当的性能水平。短期内,这可能减少AI模型训练需求,但长期来看,低成本模型可能推动推理需求增长。对于中国软件行业,该模型可能降低AI功能门槛,但变现能力仍取决于市场需求。总而言之,DeepSeek R1的出现对数据中心和软件行业都将产生深远影响。

🚀DeepSeek R1模型以开源形式发布,其训练成本仅为GPT的1/30,但性能却能达到与GPT相当的水平,这引发了人们对大规模高端GPU集群训练LLM必要性的重新思考。

📉短期来看,如果大型科技公司采用类似DeepSeek的技术路线,可能会减少对AI模型训练的需求,尤其是在偏远地区的数据中心。这可能导致短期内相关数据中心的需求下降。

📈长期来看,低成本模型可能会推动推理需求的增长,这对于一线城市的数据中心需求是利好的。这意味着在长期,数据中心的需求可能会因为推理任务的增加而得到提升。

💡对于中国软件行业而言,DeepSeek R1的出现可能会带来选择性的小幅利好。AI模型成本的降低可能会降低应用程序运行AI功能的门槛,从供给侧改善行业环境。但是否能转化为变现能力,还取决于市场需求。

近日,开源大语言模型DeepSeek R1的走红引发了业界关注。大摩表示,这一模型以远低于GPT的训练成本实现了相近的性能,或将对中国数据中心和软件行业产生深远影响。

1月27日,摩根士丹利分析师Yang.Liu、Tom.Tang、Lydia.Lin发布报告称,DeepSeek R1的出现引发了人们对采用大规模高端GPU集群来训练大型语言模型(LLM)必要性的讨论。该模型作为开源项目,其训练成本仅为GPT的1/30,却能达到与GPT相当的性能水平。

大摩认为,对于中国数据中心而言,DeepSeek R1的影响可能如下

    短期内,如果大型科技公司开始采用类似DeepSeek的技术路线,可能会减少AI模型训练相关的需求,特别是在偏远地区的数据中心。

    然而从长远来看,低成本模型可能会推动推理需求的增长,这对一线城市的数据中心需求是利好。

另一方面,对于中国软件行业,大摩认为DeepSeek R1的影响可能会带来选择性的小幅利好。因为AI模型成本的降低可能会降低应用程序运行AI功能的门槛,从供给侧改善行业环境。然而,这并不直接意味着更好的变现能力,软件行业最大的问题仍然在需求端。

摩根士丹利认为,最终影响将取决于具体的软件产品及其下游市场。

风险提示及免责条款
市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

DeepSeek R1 大语言模型 AI训练成本 数据中心 软件行业
相关文章