英国媒体称,中国人工智能起步公司深度求索(DeepSeek)的R2模型,因使用华为晶片训练遇到问题而推迟发布。

路透社引述英国《金融时报》报道,多名消息人士称,DeepSeek在1月发布R1型号后,被当局鼓励使用华为晶片,而非英伟达的产品,但却因华为晶片的技术问题,推迟了R2新模型的发布,这凸显北京试图取代美国技术的局限性。

另据腾讯科技报道,市场近日再度传出DeepSee R2即将发布的消息,预计时间窗口为8月15日至30日。

接近DeepSeek的人士星期三(8月13日)回应称,相关消息不实,DeepSeek-R2在8月内并无发布计划。DeepSeek内部人士也告诉澎湃新闻,相关发布计划不属实。

报道称,这已是DeepSeek今年内第二次传出新模型发布消息后又归于沉寂;DeepSeek近半年的动态重心并非推出全新一代模型,而是对现有产品线进行“小步快跑”式的迭代优化。

路透社今年2月引述知情人士称,DeepSeek在1月推出引起全球关注的R1大模型之后,正加快推出新一代大模型R2。公司原计划在5月初发布R2,后又希望尽早推出,具体时间尚未透露。另外,DeepSeek希望新模型在代码生成方面表现更佳,并具备在英语之外的语言中进行推理的能力。

DeepSeek最近一次版本升级为5月29日推出的DeepSeek-R1-0528。与之前的DeepSeek-R1相比,DeepSeek-R1-0528仍然使用2024年12月发布的DeepSeek V3 Base模型作为基座,但在后训练过程中投入了更多算力,提升了模型的思维深度与推理能力。

大数据服务商QuestMobile的数据显示,虽然DeepSeek仍是中国用户量最多的人工智能工具平台,但它的移动端月活跃用户规模已经从3月的1亿9400万人下降至6月的1亿6300万人。Semianalysis的统计数据则显示,DeepSeek的使用率已由年初高点的7.5%下滑至7月的3%。