原创 小茸茸 2025-02-19 09:17 重庆
OpenAI 开源 o3 mini 还是移动端模型?;LLaDA:大语言扩散模型,性能媲美 LLaMA3;xAI 发布 Grok 3:超越 DeepSeek R1;Perplexity 开源无审查版 DeepSeek R1 1776 模型
OpenAI CEO 发起投票:开源 o3 mini 还是移动端模型?
OpenAI CEO Sam Altman[1] 发起了一项投票,询问社区是希望开源 o3 mini(仅在 GPU 上运行)还是开源一个能在手机上运行的模型。
目前已有超过 12 万次投票,其中 53.9% 的参与者选择了 o3 mini。
评论中有人高呼投票给 o3 mini,然后等待开源社区将其蒸馏以便在移动端运行,笑死。
OpenAI 终于要 Open 了?
LLaDA:大语言扩散模型,性能媲美 LLaMA3
LLaDA[2](Large Language Diffusion with Masking)是一个从头开始训练的扩散模型,规模达到 8B,性能与 LLaMA3 8B 相当。
与传统的从左到右的生成方法不同,LLaDA 通过扩散模型生成文本。其核心是通过“前向掩码”和“反向预测”来生成文本,而不是像 ChatGPT 那样逐个生成单词。
LLaDA 可以更好地实现反向推理,不过目前该模型只发布了论文,代码和模型正在路上。
xAI 发布 Grok 3:超越 DeepSeek R1
Grok 3[3] 现已发布,直播中展示了其在多个基准测试中的卓越表现,包括数学、科学和编程等领域,超越了 OpenAI GPT-4o、Google Gemini、DeepSeek V3 以及 Anthropic Claude 等顶尖模型。其推理模式(代号 "chocolate")在 Chatbot Arena 平台的盲测中目前排名第一。
Grok 3 还引入了 DeepSearch 和 Big Brain 功能,前者增强了信息检索的深度和准确性,后者则提供了更高级的处理能力。
目前,Grok 3 首先为 X 的 Premium+ 订阅用户开放,并推出了新的订阅计划 SuperGrok,价格为每月 300。
此外 xAI 计划在未来几周内为 Grok 3 添加语音交互功能,并通过企业 API 提供其能力。他们还表示,xAI 表示将在 Grok 3 稳定后开源 Grok 2。
昆仑万维开源 SkyReels-V1 视频模型
SkyReels-V1[4] 是由昆仑万维开发的开源视频生成模型,专注于 AI 短剧创作。
该模型的主页介绍表示其通过对千万级高质量影视数据的微调,具备生成电影级光影效果、细腻表情和自然动作的能力。
其功能包括文生视频和图生视频,支持 33 种表情和 400 多种动作组合,利用其自研推理框架 SkyReels-Infer 提升了推理效率。
目前,该模型已经开源,并且支持商业用途。
Perplexity 开源无审查版 DeepSeek R1 1776 模型
R1 1776[5] 是 Perplexity 昨天开源的一个无审查版本的 DeepSeek R1。这个模型经过特别的后续训练,能够提供无审查的信息。
目前,用户可以在 HuggingFace 上下载该模型,或者通过 Perplexity 的 Sonar API 使用。
虽然其基准性能与 R1 几乎无异,但考虑到国内的特殊环境,建议谨慎使用此模型。
❝如果你喜欢《一觉醒来 AI 界发生了什么》系列的话,请 关注、点赞、在看、收藏、分享 五连警告,这对我真的很重要!
Reference
[1]
Sam Altman 的 Twitter 投票: https://x.com/sama/status/1891667332105109653
[2]LLaDA 项目主页: https://ml-gsai.github.io/LLaDA-demo/
[3]Grok 3 发布直播回放: https://x.com/i/broadcasts/1gqGvjeBljOGB
[4]SkyReels-V1 开源模型页面: https://huggingface.co/Skywork/SkyReels-V1-Hunyuan-I2V
[5]R1 1776 模型下载页面: https://huggingface.co/perplexity-ai/r1-1776