DeepSeek发布了名为NSA的新型稀疏注意力机制,旨在实现超快速的长上下文训练和推理。NSA通过优化设计,在不影响性能的前提下,显著提升了推理速度并降低了预训练成本。民生证券认为,DeepSeek等头部模型的发展加速了AI应用和AIAgent的落地,推动AI算力需求从训练驱动转向推理驱动。微信等国民级应用接入DeepSeek,进一步放大了算力需求,为算力行业带来了重要的发展机遇。青云科技和润建股份等公司也纷纷推出与DeepSeek相关的AI算力云服务和国产算力政务智能体一体机。
🚀DeepSeek发布NSA技术:NSA是一种与硬件一致且本机可训练的稀疏注意力机制,专为超快速的长上下文训练和推理设计,优化了推理速度并降低了预训练成本。
💡AI算力需求拐点:民生证券指出,DeepSeek等头部模型的发展加速了AI应用和AIAgent的落地,推动AI算力需求从训练驱动转向推理驱动,算力行业迎来重要发展机遇。
📱国民级应用接入:微信等头部APP接入DeepSeek后,国民级应用模型使用持续放大算力需求,进一步促进推理等算力需求的增长。
☁️上市公司积极布局:青云科技上线DeepSeek-R1系列模型的AI算力云服务,润建股份联合希姆计算发布DeepSeek加持的全国产算力政务智能体一体机,构建自主可控的生态。
据媒体报道,2月18日,DeepSeek在社交平台X上发布了一篇关于NSA的纯技术论文报告。DeepSeek称,NSA是一种与硬件一致且本机可训练的稀疏注意力机制,用于超快速的长上下文训练和推理。通过针对现代硬件的优化设计,NSA加快了推理速度,同时降低了预训练成本,而不会影响性能。在一般基准测试、长上下文任务和基于指令的推理上,它的表现与完全注意力模型相当甚至更好。
民生证券表示,DeepSeek等头部模型的发展让AI应用、AIAgent等加速落地,使用量快速提升推动AI算力需求进入从训练推动到推理推动的拐点,Deepseek或是算力星辰大海的一朵“小浪花”。从微信等头部APP接入DeepSeek后可以看到,国民级应用模型使用持续放大算力需求,进而带来推理等算力需求的大量增长,算力行业迎来重要发展机遇。
据财联社主题库显示,相关上市公司中:
青云科技旗下AI算力云服务——基石智算CoresHub正式上线DeepSeek-R1系列模型。
润建股份联合希姆计算打造完全自主可控的“算力-算法-应用”全国产闭环生态,采用自主研发AI芯片、编译器、工具链与DeepSeek深度耦合,发布业内领先的DeepSeek加持全国产算力政务智能体一体机。