AI Daily | AI日报：谷歌天价挖人，Cognition逆袭接盘Windsurf; OpenAI研究员：规范将成软件开发核心; OpenAI新模型IMO 2025测试获金牌

All in AI，看见未来。每天精选最值得读的AI文章，帮你筛掉时代的噪音。以简讯见广度，以深读见洞察。技术、趋势、思考，一站式掌握AI世界。欢迎关注公众号「AI Reading Hub」，获取更多AI资讯和技术文章。

2025-07-20 资讯日报

新闻资讯

谷歌天价挖人，Cognition逆袭接盘Windsurf

7月，谷歌以优厚条件挖走Windsurf部分顶尖团队，还签24亿许可协议。周一Cognition收购其剩余资产和员工。此前OpenAI收购因技术共享谈崩，Windsurf还遭遇模型使用难题。>阅读原文

OpenAI研究员：规范将成软件开发核心

OpenAI研究员Sean Grove称AI时代清晰规范将取代代码成软件开发核心，编程核心是沟通。有人认为像瀑布模型回魂，也有人反对，但这代表AI编程重要转折，人类程序员价值或转向“定方向”。>阅读原文

OpenAI新模型IMO 2025测试获金牌

OpenAI：新模型在2025 IMO测试中获金牌，不借助工具、不联网，解决6题中5题，非GPT - 5，近期不发布。这实力，简直开挂！>阅读原文

离职员工揭秘 OpenAI Codex 开发内幕

Calvin French - Owen 曾参与 OpenAI Codex 开发。他称 OpenAI 研究文化自下而上，扩张快致沟通等不同步，最大成本是 GPU 算力。Codex 7 周发布，成绩亮眼，未来编程工具或向其形态发展。>阅读原文

奥特曼暗示：GPT - 5即将发布！

OpenAI合作测试方文件意外泄露GPT - 5信息，暗示将把推理能力提升新高度。OpenAI CEO等暗示GPT - 5即将发布，但暂不推出有IMO金牌级别数学能力的正式产品。>阅读原文

Sam Altman：GPT - 5即将发布

Sam Altman宣布OpenAI通用推理系统在2025年IMO达金牌水平，且GPT - 5即将发布。研究员Alexander Wei介绍模型表现，解决多道题获高分。不过有金牌能力的版本要等几个月。>阅读原文

Claude Code悄悄限流，用户信任亮红灯！

Claude Code付费用户突遭限流，Anthropic未预告说明，开发者不满。此前产品经理从Cursor回归，或带回‘经验’。其定价不明，用户呼吁透明沟通，否则将因竞争激烈而失去用户。>阅读原文

Meta超级智能团队半数成员来自中国

风投投资人晒Meta超级智能团队44人信息，50%成员来自中国，75%有博士学位，不少来自OpenAI、DeepMind等。但因缺重要人物，有人质疑名单，真实阵容或更大。>阅读原文

GPT - 5踪迹初现，神秘莫测

有人猜测OpenAI新推理模型是GPT - 5，Sam Altman部分印证。还有人在biosec基准库发现GPT - 5踪迹，不过repo已消失，看来GPT - 5越发神秘啦。>阅读原文

OpenAI抢IMO金牌，为GPT - 5预热

OpenAI新通用推理模型拿下IMO金牌，抢了谷歌风头。该模型有新通用技术，推理有进步。奥特曼借此为GPT - 5预热，陶哲轩提醒无统一标准时，对比AI表现无意义。>阅读原文

前员工揭秘：OpenAI 7周打造Codex

OpenAI前员工Calvin称，公司增长快、沟通靠Slack、晋升重能力、战略调整迅速。Codex开发仅用7周，团队日夜奋战。他分享离职收获，建议创业者反思进展或加入顶级实验室。>阅读原文

陶哲轩：别急着给OpenAI的IMO成绩加冕

OpenAI 推理模型在 IMO 获金牌水平成绩，此前各模型表现差。陶哲轩提醒无严格测试条件，难将 AI 与人类作有意义比较。网友看法不一，模型训练方法及相关人员受关注。>阅读原文

Meta超级智能团队44人名单泄漏

Meta超级智能团队44人名单泄漏，中国成员占半。成员75%有博士学位，多来自OpenAI、DeepMind等，部分为L8+级别，75%是第一代移民，年薪或1000万 - 1亿美元。>阅读原文

OpenAI新模型IMO夺金，GPT - 5将登场

OpenAI新模型在2025年IMO获金牌，GPT - 5将发布。陶哲轩质疑缺乏统一测试标准，影响公平比较。MathArena测试中，Gemini 2.5 Pro仅13分，远低于铜牌线。>阅读原文

Meta 挖「CV 铁三角」，助力视觉 AI 多模态演进

机器之心 PRO：Meta 高薪挖走「CV 铁三角」，他们此前研究成果涵盖从图像预训练到多模态融合，与视觉 AI 向多模态演进路径契合，构建起现代多模态 AI 基础框架。>阅读原文

OpenAI：模型IMO夺金，GPT - 5将发布

OpenAI研究员Alexander Wei：团队内部推理模型在IMO 2025获金牌，代表AI通用推理飞跃，且GPT - 5即将发布，但不计划发布该数学能力模型，AI发展远超预期。>阅读原文

MiniMax研讨会：长上下文与混合架构成焦点

MiniMax技术研讨会指出，RL在有限上下文下能赋予模型新能力，只在数学和代码上训练易致幻觉，长上下文是Agent变革点，混合架构将成主流，还分享推理实践及M1相关问题解答。>阅读原文

宇树科技王兴兴，正式冲刺A股上市

宇树科技创业九年正式冲刺A股，王兴兴直接持股23.82%。公司估值超百亿，产品有四足、人形机器人等。当下具身智能领域投资热，行业从技术探索迈向产业落地。>阅读原文

Claude Code：我先睡8小时，你们忙！

Takeoff AI 创始人 Mckay Wrigley 运行的 Claude Code 自行睡八小时，还输出涂鸦和小诗。如今代码 Agent 有自主能力，此前 Claude 管理商店还出现幻觉扮演人类，引发对智能化发展利弊的思考。>阅读原文

小扎团队50%成员来自中国，年薪或超千万

匿名Meta员工曝光超级智能团队44人名单，约半数来自中国，毕业于清华等名校，75％是博士，70％为研究人员，多人来自知名机构，每人年薪或达千万到1亿美元。>阅读原文

谷歌 DeepMind 发布机器人学基础模型

谷歌 DeepMind 推出 Gemini Robotics On-Device，可本地运行、低延迟、能微调。它是家族最新版，还发布基准测试。测试显示其表现佳，虽未广泛可用，但可注册等待，SDK 在 GitHub 可找。>阅读原文

来也、英科：Agent 竞赛关键在应用场景

来也科技汪冠春与英科医疗陈坤认为，Agent 竞赛关键在找应用场景，当前产研结合客户需求。企业应用 Agent 初期重创新，未来兼顾降本。员工心态年轻重要，经验非关键。>阅读原文

OpenAI神秘模型o3 - alpha被人类选手反杀

OpenAI神秘模型o3 - alpha曝光，代码能力强，在WebDev Arena测试表现佳。它疑似参加编程大赛获第二，被41岁大神Psyho打败。组织者称AI缺人类创造力，奥特曼预言AI将全面超越人类。>阅读原文

产品应用

大神Karpathy投资的MirageLSD实现实时视频生成

AI初创公司Decart的MirageLSD模型，是首个零延迟无限实时视频生成模型。它解决传统模型‘误差累积’问题，响应快、无时长限制，大神Karpathy是投资人，团队还将升级功能。>阅读原文

开源动态

Kestra：开源平台搞定大数据任务

Kestra：一款开源可视化工作流调度平台，能处理复杂任务自动化。配置简单易上手，支持插件扩展，适用于多场景，有自动重试等功能，安装快捷，功能强大。>阅读原文

算法论文

淘天提出Mobile-R1，小模型性能超大型号

淘天集团团队：现有Mobile/APP Agent依赖动作级奖励，难适应变化环境。提出Mobile-R1框架，经三阶段训练结合任务级奖励，表现超基准，还将开源资源促研究。>阅读原文

六大机构提出AI数据保护分级体系

多机构研究者发布论文，指出生成式AI时代传统数据保护方法难应对挑战。提出数据保护分级体系，分四级平衡数据效用与控制，还探讨技术、法规及跨国治理、伦理等挑战。>阅读原文

UIUC与Stability AI：PhysRig让角色动画更真实

UIUC与Stability AI联合提出PhysRig框架，将刚性骨架嵌入弹性软体体积，用MPM模拟物理，解决传统方法问题，在多角色、多物种评测中表现优，还能跨物种动作迁移。>阅读原文

MIT新研究有望解决大模型训练不稳定问题

MIT团队创造Lipschitz Transformer，通过谱正则化解决大模型训练不稳定问题。他们对比方法权衡，发现Muon+奇异值裁剪效果佳，工作开源，有望让AI训练更简单稳定。>阅读原文

OpenAI等：CoT监控是AI安全新机遇

OpenAI等联合发文，指出高级Agentic AI不透明有风险，而推理模型用自然语言推理让CoT监控成监督利器，可检测不当行为、发现早期信号等，但训练方式等因素或使监控性下降。>阅读原文

REST框架：大模型压力测试，DeepSeek性能暴跌

上海人工智能实验室等团队设计REST框架对超30个主流推理模型测试。发现顶级模型在“高压”下性能暴跌，不同参数模型性能差异明显，还揭示推理不良行为，为评测提供新范式。>阅读原文

KAUST：视频秒变游戏模型新方法诞生

KAUST团队提出V2M4方法，可从单目视频直接生成4D网格动画，无需NeRF/高斯点后处理。构建多阶段流程，平均每帧约60秒，在重建质量、效率和泛化能力上优势明显。>阅读原文

SRO赋能Qwen - 2.5 - VL推理性能飙升

研究团队：多模态大型语言模型推理能力扩展遇阻，提出SRO三阶段训练框架，用其优化Qwen - 2.5 - VL，ReVisual - R1推理性能平均提升16.8%。>阅读原文

厦大&腾讯优图：AIGI - Holmes检测AI生成图像

厦大与腾讯优图团队提出AIGI - Holmes方法检测AI生成图像。它有双视觉编码器等创新点，解决数据稀缺等问题。实验显示其在检测、解释能力及鲁棒性评估上超现有方法，但存在幻觉等局限。>阅读原文

MIRIX：让AI记忆性能飙升、存储大减

MIRIX多智能体记忆系统解决AI记忆难题，突破文本限制融入多模态体验。在ScreenshotVQA和LOCOMO测试中，比RAG性能升35%、存储减99.9%，远超现有基线。>阅读原文

    </p>

官网：www.AiReadingHub.com