钛媒体:引领未来商业与生活新知 02月18日
一天开源五个模型,AI 热潮将加速今年中国智算规模增长43%|钛媒体AGI
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

近期,AI模型开源浪潮持续高涨。阶跃星辰与吉利汽车联合开源Step系列多模态大模型,包括全球参数量最大、性能最佳的开源视频生成模型Step-Video-T2V和首款产品级开源语音交互大模型Step-Audio。昆仑万维也发布了面向AI短剧创作的视频生成模型SkyReels-V1,及表情动作可控算法SkyReels-A1。这些开源举措不仅降低了AI应用门槛,也促进了AI技术在各行业的融合与创新。同时,中国AI算力市场规模持续增长,相关企业注册量和人才需求也显著提升,预示着AI产业的蓬勃发展。

🎬 阶跃星辰开源Step-Video-T2V,参数达300亿,可生成204帧、540P高质量视频,并发布文生视频质量评测基准数据集 Step-Video-T2V-Eval,包含128条中文评测问题,从运动、风景、人物等11个维度评估生成视频质量。

🗣️ 阶跃星辰还开源了首款产品级语音交互大模型Step-Audio,拥有1300亿参数,能根据场景需求生成不同情绪、方言、语种的表达,并进行高质量对话和音色复刻,满足影视娱乐等行业需求,且在主流测试集中表现突出。

🎭 昆仑万维发布SkyReels-V1,支持文生视频和图生视频,是开源视频生成模型中参数最大的支持图生视频的模型,在同等分辨率下指标达到开源SOTA,并开源了表情动作可控算法SkyReels-A1,加速AI短剧创作。

💰 中国AI算力市场规模持续扩大,预计2025年将达到259亿美元,同比增长36.2%,同时,AI相关企业注册量和人才需求也显著增加,计算机软硬件人才供需和薪资待遇走高。

阶跃星辰最新开源视频模型Step-Video-T2V效果(来源:受访者提供)

DeepSeek引发的开源大模型热潮依然在继续,今天一天共有超过五款 AI 模型对外公布开源消息。

钛媒体AGI获悉,2月18日上午,“大模型六小虎”之一通用人工智能公司的阶跃星辰,与吉利汽车集团联合宣布,将双方合作的阶跃两款Step系列多模态大模型向全球开发者开源。

其中,全球范围内参数量最大、性能最好的开源视频生成模型阶跃Step-Video-T2V 将进行开源,参数量达到300亿,可直接生成204帧、540P分辨率的高质量视频。

阶跃星辰第二款开源模型,是行业内首款产品级开源语音交互大模型阶跃Step-Audio,高达1300亿参数规模,能够根据不同的场景需求生成情绪、方言、语种、歌声和个性化风格的表达,能和用户自然地高质量对话、高质量音色复刻并进行角色扮演,满足影视娱乐、社交、游戏等行业场景下应用需求。

在主流公开测试集中,阶跃Step-Audio模型性能表现突出。此外,阶跃星辰还自建并开源了多维度评估体系 StepEval-Audio-360 基准测试。

阶跃星辰第三款开源模型,是发布并开源了针对文生视频质量评测的新基准数据集 Step-Video-T2V-Eval,包含128条源于真实用户的中文评测问题,旨在评估生成视频在运动、风景、动物、组合概念、超现实、人物、3D 动画、电影摄影等 11 个内容质量维度。评测结果显示,阶跃Step-Video-T2V 的模型性能在指令遵循、运动平滑性、物理合理性、美感度等方面优异。

目前,在跃问网页端和跃问 App 上都可以体验阶跃Step-Video-T2V 的视频生成能力。值得注意的是,早前阶跃星辰“跃问”产品正式接入DeepSeek模型,提供“深度思考”服务。

不止是阶跃星辰。2月18日上午,昆仑万维宣布,联合开源中国发布首个面向AI短剧创作的视频生成模型SkyReels-V1,以及中国首个SOTA级别基于视频基座模型的表情动作可控算法SkyReels-A1。

其中,昆仑万维称,SkyReels-V1不仅支持文生视频、还能支持图生视频,是开源视频生成模型中参数最大的支持图生视频的模型,在同等分辨率下各项指标实现开源SOTA。

SkyReels-V1文生视频指标对比

算力层面,昆仑万维称,在自研推理优化框架“SkyReels-Infer”的加持下,V1大幅提升推理效率,实现544p分辨率,推理基于单台4090只需80s,还支持分布式多卡并行。在同等RTX4090资源情况下,SkyReels-Infer版本比腾讯混元HunyuanVideo官方版本端到端延迟减少58.3%(293.3s vs 464.3s)。此外,采取新的技术可满足低显存用户级显卡运行需求,以及支持模型编译优化等,进一步优化延迟,而基于开源diffuser库,提升易用性。

昆仑万维表示,同时将SOTA级别的SkyReels-V1和SkyReels-A1进行开源,是AI短剧行业首例,也是昆仑万维SkyReels回馈行业迈出的一小步,更是促进AI短剧创作和视频生成行业枝繁叶茂的一大步。未来,短剧与游戏、虚拟现实等领域的跨界发展,将会加速产业融合,并且AI短剧也有希望从“技术实验”迈向“主流创作”,成为全球文化输出的新载体。

事实上,自1月中旬起,中国开源 AI 模型DeepSeek横空出世,震动了整个AI科技行业,其成本便宜,DeepSeek-V3仅用两个月就完成了训练,成本为560万美元,仅为OpenAI等公司所花费金额的一小部分。另一方面,DeepSeek是开源模式,迅速吸引了包括互联网科技公司及其他领域用户介入,尤其对于算力、AI人才都会有新的促进作用。

2月16日,IDC与浪潮信息联合发布的《中国人工智能计算力发展评估报告》显示,2024年,中国智能算力规模、市场规模分别同比增长74.1%、86.9%,预计2025年,中国智能算力规模较2024年将增长43%;中国人工智能算力市场规模将达到259亿美元,较2024年增长36.2%。

钛媒体AGI从企查查处获悉,截至目前,中国现存算力相关企业647家。近十年相关企业注册量呈整体增长态势,2024年,全年注册207家相关企业,同比增长52.21%,而2025年国内则已经注册15家 AI 算力相关企业。

从注册资本分布来看,超40%算力相关企业注册资本在千万元以上,从行业上看,超四成相关企业归属于科学研究和技术服务业。

人才层面,智联招聘发布的最新报告显示,从求职端看,计算机硬件、计算机软件行业第二周求职人数环比增速分别为49.9%、38.6%,位列行业前二,IT服务、通信/电信/网络设备行业求职也环比增长3成;从职业看,前端开发、软件研发、移动研发、测试工程师、人工智能工程师、通信及硬件研发等技术岗位求职环比增速均在3-5成;从招聘薪酬看,节后第二周,计算机软件、计算机硬件行业平均招聘月薪分别为11360元、10660元,较第一周分别上涨8.3%、5.9%。

报告指出,AI发展对整个信息技术产业提振效果显现,计算机硬件/软件人才供需、薪资待遇走高。

就在2月18日,OpenAI CEO奥尔特曼(Sam Altman)表示开源下一代模型,询问大家希望下一个开源项目是哪一种,是做一个“相当小但仍需要在GPU上运行的o3-mini级模型”,或者“能做的最好的手机大小的模型”。

这意味着,OpenAI 即将开源某个大模型,而这一举措,无疑是对当前AI开源趋势的积极响应。

就在奥特曼发文的同一天,也是马斯克宣布要发布“世界上最聪明的人工智能”的时间。马斯克旗下的人工智能初创公司xAI将发布最新版Grok 3聊天机器人,尽管比原计划推迟了数月,但仍引起外界高度关注。

(本文首发于钛媒体App,作者|林志佳)

 

更多精彩内容,关注钛媒体微信号(ID:taimeiti),或者下载钛媒体App

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

AI模型开源 视频生成 语音交互 AI算力 AI短剧
相关文章