一、OpenAI模型命名规则解析
OpenAI的命名体系通过基础名称+版本号+功能后缀的组合反映模型定位,具体规则如下:
主版本号(如GPT-3/4/5)
- 数字越大代表技术代际越新,核心架构升级(如GPT-4支持多模态,GPT-5统一产品线)。
字母后缀
o
:代表“omni”(全能),支持多模态输入输出(如GPT-4o支持文本、图像、音频)。oss
:开源模型标识(如gpt-oss-120b)。性能后缀
Turbo
:响应速度优化版(如GPT-3.5 Turbo)。Pro
:增强性能版(如o1-pro)。mini
:轻量级版本,资源占用低(如o4-mini)。专用系列
O系列
:专注逻辑推理与工具调用(如O3、O4-mini)。DALL·E/Sora
:图像/视频生成专用模型。二、常见模型清单与对比
1. 商业闭源模型
模型名称 | 类型 | 发布时间 | 核心能力与参数 | 典型应用场景 | 多模态支持 |
---|---|---|---|---|---|
GPT-5 | 全能多模态 | 2024年8月 | 文本/图像/音频/视频交互,400K上下文 | 跨媒体创作、实时会议纪要 | ✅ 全支持 |
GPT-4o | 全能多模态 | 2024年5月 | 文本/图像/音频/视频交互,128K上下文 | 跨媒体创作、实时会议纪要 | ✅ 全支持 |
GPT-4.5 | 文本优化 | 2025年2月 | 情感表达优化,32K上下文 | 社交媒体文案、客户沟通 | ❌ |
o3 | 推理旗舰 | 2025年4月 | 复杂逻辑推理,工具调用,视觉推理 | 科研分析、商业决策 | 🟡 有限支持 |
o4-mini | 轻量推理 | 2025年4月 | 200K上下文,低成本高吞吐 | 数据清洗、编程辅助 | ❌ |
GPT-4.1 | 长文本处理 | 2025年4月 | 100万Token上下文,精准指令执行 | 法律合同分析、金融文档审核 | ❌ |
DALL·E 3 | 图像生成 | 2024年 | 高分辨率图像生成与编辑 | 创意设计、营销素材生成 | ✅ 图像 |
Sora | 视频生成 | 2025年 | 文本生成视频(未全面开放) | 短视频创作、影视预演 | ✅ 视频 |
2. 开源模型
模型名称 | 类型 | 发布时间 | 核心能力与参数 | 典型应用场景 | 多模态支持 |
---|---|---|---|---|---|
gpt-oss-120b | 推理生产级 | 2025年8月 | 117B参数(MoE),128K上下文 | 企业级推理、工具链调用 | 🟡 有限支持 |
gpt-oss-20b | 轻量本地化 | 2025年8月 | 21B参数(MoE),消费级设备可部署 | 边缘计算、专用场景推理 | 🟡 有限支持 |
Whisper | 语音识别 | 2022年 | 多语言转录与翻译 | 会议记录、字幕生成 | ✅ 音频 |