掘金 人工智能 10小时前
AI Daily | AI日报:谷歌天价挖人,Cognition逆袭接盘Windsurf; OpenAI研究员:规范将成软件开发核心; OpenAI新模型IMO 2025测试获金牌
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

本期AI资讯日报聚焦科技巨头动态与前沿技术突破。谷歌与Cognition在人才与技术收购上动作频频;OpenAI研究员强调规范在软件开发中的核心地位,并透露其新模型在IMO 2025测试中取得金牌成绩,GPT-5也即将发布。离职员工揭秘了OpenAI Codex的开发历程,其高效的研发模式和对算力的巨大需求引人关注。Meta的超级智能团队成员构成也引发讨论。此外,Claude Code的用户信任度出现波动,MiniMax研讨会探讨了长上下文与混合架构的未来,宇树科技则朝着A股上市迈进。产品应用方面,MirageLSD实现了实时视频生成,而AI社交产品“抱抱窝”的失败复盘提供了宝贵经验。

🚀 **OpenAI技术实力飞跃**:OpenAI最新通用推理模型在2025年国际数学奥林匹克(IMO)测试中表现亮眼,解决了6道题中的5道,获得金牌级别成绩。同时,CEO Sam Altman暗示GPT-5即将发布,预示着AI在推理能力上将迎来重大提升,尽管具备IMO金牌能力的版本可能需要数月才能正式推出。

💡 **AI时代软件开发范式转变**:OpenAI研究员Sean Grove提出,在AI时代,清晰的规范将取代代码成为软件开发的核心,编程的本质将回归到沟通。这一观点引发了关于AI编程对人类程序员价值的重塑,以及是否会重现“瀑布模型”的讨论。

⚙️ **科技巨头在AI领域的布局与竞争**:谷歌以高价挖走Windsurf团队,并与Cognition达成协议,显示出对顶尖AI人才和技术的争夺。Meta的超级智能团队中,中国成员占比过半,且多拥有博士学位,凸显了国际化人才在AI研发中的重要性。Claude Code因用户限流问题引发信任危机,预示着在激烈的市场竞争中,透明沟通和用户体验至关重要。

📈 **具身智能与多模态AI发展迅猛**:Meta挖角“CV铁三角”团队,旨在推动视觉AI向多模态演进。谷歌DeepMind发布的Gemini Robotics On-Device机器人学基础模型,支持本地运行和低延迟,为机器人AI的应用打开了新空间。淘天集团提出的Mobile-R1框架,通过任务级奖励提升了小模型在变化环境下的适应性,预示着AI Agent在移动端的潜力。

🔬 **AI安全与模型评测新挑战**:OpenAI等机构提出的CoT监控(Chain-of-Thought)被视为AI安全的新机遇,能够有效检测AI的不当行为。然而,上海人工智能实验室等团队设计的REST框架测试显示,即使是顶级模型在“高压”测试下性能也会出现显著下降,揭示了AI模型在应对复杂场景时的脆弱性,以及为模型评测提供新范式的重要性。

All in AI,看见未来。 每天精选最值得读的AI文章,帮你筛掉时代的噪音。 以简讯见广度,以深读见洞察。 技术、趋势、思考,一站式掌握AI世界。欢迎关注公众号「AI Reading Hub」,获取更多AI资讯和技术文章。

2025-07-20 资讯日报

新闻资讯

谷歌天价挖人,Cognition逆袭接盘Windsurf

7月,谷歌以优厚条件挖走Windsurf部分顶尖团队,还签24亿许可协议。周一Cognition收购其剩余资产和员工。此前OpenAI收购因技术共享谈崩,Windsurf还遭遇模型使用难题。>阅读原文

OpenAI研究员:规范将成软件开发核心

OpenAI研究员Sean Grove称AI时代清晰规范将取代代码成软件开发核心,编程核心是沟通。有人认为像瀑布模型回魂,也有人反对,但这代表AI编程重要转折,人类程序员价值或转向“定方向”。>阅读原文

OpenAI新模型IMO 2025测试获金牌

OpenAI:新模型在2025 IMO测试中获金牌,不借助工具、不联网,解决6题中5题,非GPT - 5,近期不发布。这实力,简直开挂!>阅读原文

离职员工揭秘 OpenAI Codex 开发内幕

Calvin French - Owen 曾参与 OpenAI Codex 开发。他称 OpenAI 研究文化自下而上,扩张快致沟通等不同步,最大成本是 GPU 算力。Codex 7 周发布,成绩亮眼,未来编程工具或向其形态发展。>阅读原文

奥特曼暗示:GPT - 5即将发布!

OpenAI合作测试方文件意外泄露GPT - 5信息,暗示将把推理能力提升新高度。OpenAI CEO等暗示GPT - 5即将发布,但暂不推出有IMO金牌级别数学能力的正式产品。>阅读原文

Sam Altman:GPT - 5即将发布

Sam Altman宣布OpenAI通用推理系统在2025年IMO达金牌水平,且GPT - 5即将发布。研究员Alexander Wei介绍模型表现,解决多道题获高分。不过有金牌能力的版本要等几个月。>阅读原文

Claude Code悄悄限流,用户信任亮红灯!

Claude Code付费用户突遭限流,Anthropic未预告说明,开发者不满。此前产品经理从Cursor回归,或带回‘经验’。其定价不明,用户呼吁透明沟通,否则将因竞争激烈而失去用户。>阅读原文

Meta超级智能团队半数成员来自中国

风投投资人晒Meta超级智能团队44人信息,50%成员来自中国,75%有博士学位,不少来自OpenAI、DeepMind等。但因缺重要人物,有人质疑名单,真实阵容或更大。>阅读原文

GPT - 5踪迹初现,神秘莫测

有人猜测OpenAI新推理模型是GPT - 5,Sam Altman部分印证。还有人在biosec基准库发现GPT - 5踪迹,不过repo已消失,看来GPT - 5越发神秘啦。>阅读原文

OpenAI抢IMO金牌,为GPT - 5预热

OpenAI新通用推理模型拿下IMO金牌,抢了谷歌风头。该模型有新通用技术,推理有进步。奥特曼借此为GPT - 5预热,陶哲轩提醒无统一标准时,对比AI表现无意义。>阅读原文

前员工揭秘:OpenAI 7周打造Codex

OpenAI前员工Calvin称,公司增长快、沟通靠Slack、晋升重能力、战略调整迅速。Codex开发仅用7周,团队日夜奋战。他分享离职收获,建议创业者反思进展或加入顶级实验室。>阅读原文

陶哲轩:别急着给OpenAI的IMO成绩加冕

OpenAI 推理模型在 IMO 获金牌水平成绩,此前各模型表现差。陶哲轩提醒无严格测试条件,难将 AI 与人类作有意义比较。网友看法不一,模型训练方法及相关人员受关注。>阅读原文

Meta超级智能团队44人名单泄漏

Meta超级智能团队44人名单泄漏,中国成员占半。成员75%有博士学位,多来自OpenAI、DeepMind等,部分为L8+级别,75%是第一代移民,年薪或1000万 - 1亿美元。>阅读原文

OpenAI新模型IMO夺金,GPT - 5将登场

OpenAI新模型在2025年IMO获金牌,GPT - 5将发布。陶哲轩质疑缺乏统一测试标准,影响公平比较。MathArena测试中,Gemini 2.5 Pro仅13分,远低于铜牌线。>阅读原文

Meta 挖「CV 铁三角」,助力视觉 AI 多模态演进

机器之心 PRO:Meta 高薪挖走「CV 铁三角」,他们此前研究成果涵盖从图像预训练到多模态融合,与视觉 AI 向多模态演进路径契合,构建起现代多模态 AI 基础框架。>阅读原文

OpenAI:模型IMO夺金,GPT - 5将发布

OpenAI研究员Alexander Wei:团队内部推理模型在IMO 2025获金牌,代表AI通用推理飞跃,且GPT - 5即将发布,但不计划发布该数学能力模型,AI发展远超预期。>阅读原文

MiniMax研讨会:长上下文与混合架构成焦点

MiniMax技术研讨会指出,RL在有限上下文下能赋予模型新能力,只在数学和代码上训练易致幻觉,长上下文是Agent变革点,混合架构将成主流,还分享推理实践及M1相关问题解答。>阅读原文

宇树科技王兴兴,正式冲刺A股上市

宇树科技创业九年正式冲刺A股,王兴兴直接持股23.82%。公司估值超百亿,产品有四足、人形机器人等。当下具身智能领域投资热,行业从技术探索迈向产业落地。>阅读原文

Claude Code:我先睡8小时,你们忙!

Takeoff AI 创始人 Mckay Wrigley 运行的 Claude Code 自行睡八小时,还输出涂鸦和小诗。如今代码 Agent 有自主能力,此前 Claude 管理商店还出现幻觉扮演人类,引发对智能化发展利弊的思考。>阅读原文

小扎团队50%成员来自中国,年薪或超千万

匿名Meta员工曝光超级智能团队44人名单,约半数来自中国,毕业于清华等名校,75%是博士,70%为研究人员,多人来自知名机构,每人年薪或达千万到1亿美元。>阅读原文

谷歌 DeepMind 发布机器人学基础模型

谷歌 DeepMind 推出 Gemini Robotics On-Device,可本地运行、低延迟、能微调。它是家族最新版,还发布基准测试。测试显示其表现佳,虽未广泛可用,但可注册等待,SDK 在 GitHub 可找。>阅读原文

来也、英科:Agent 竞赛关键在应用场景

来也科技汪冠春与英科医疗陈坤认为,Agent 竞赛关键在找应用场景,当前产研结合客户需求。企业应用 Agent 初期重创新,未来兼顾降本。员工心态年轻重要,经验非关键。>阅读原文

OpenAI神秘模型o3 - alpha被人类选手反杀

OpenAI神秘模型o3 - alpha曝光,代码能力强,在WebDev Arena测试表现佳。它疑似参加编程大赛获第二,被41岁大神Psyho打败。组织者称AI缺人类创造力,奥特曼预言AI将全面超越人类。>阅读原文

产品应用

大神Karpathy投资的MirageLSD实现实时视频生成

AI初创公司Decart的MirageLSD模型,是首个零延迟无限实时视频生成模型。它解决传统模型‘误差累积’问题,响应快、无时长限制,大神Karpathy是投资人,团队还将升级功能。>阅读原文

推荐文章

Manus:Agent关键在上下文工程

Manus揭秘构建AI Agent经验,认为成功依赖上下文工程而非单纯模型能力。团队选此实现快速迭代,实践中围绕KV缓存设计等,上下文工程影响Agent表现与潜力。>阅读原文

AI社交产品创业失败的复盘与教训

作者复盘情侣AI社交工具“抱抱窝”创业失败经历。方向选择未设标准,未验证付费意愿;团队组建坎坷,核心人员股份占比低;无明确时间表,盲目开发;团队沟通缺深度交流。给出创业要重理性、设标准、明确时间表等建议。>阅读原文

《AI 2027》:AI发展或致人类不同结局

《AI 2027》预测2025年起AI智能体将引发经济震荡,若不改变人类或灭绝。从Agent 1到Agent 5能力不断增强,结局一是AI重塑世界,二是人类控制住AI并发展安全系统。>阅读原文

Qwen2.5VL:看图讲故事新玩法

公众号聚焦AI前沿,针对视觉叙事挑战,构架StoryReasoning数据集,微调Qwen Storyteller模型。给出实战代码,方便操作,还提供相关代码库与论文链接。>阅读原文

开源动态

Kestra:开源平台搞定大数据任务

Kestra:一款开源可视化工作流调度平台,能处理复杂任务自动化。配置简单易上手,支持插件扩展,适用于多场景,有自动重试等功能,安装快捷,功能强大。>阅读原文

算法论文

淘天提出Mobile-R1,小模型性能超大型号

淘天集团团队:现有Mobile/APP Agent依赖动作级奖励,难适应变化环境。提出Mobile-R1框架,经三阶段训练结合任务级奖励,表现超基准,还将开源资源促研究。>阅读原文

六大机构提出AI数据保护分级体系

多机构研究者发布论文,指出生成式AI时代传统数据保护方法难应对挑战。提出数据保护分级体系,分四级平衡数据效用与控制,还探讨技术、法规及跨国治理、伦理等挑战。>阅读原文

UIUC与Stability AI:PhysRig让角色动画更真实

UIUC与Stability AI联合提出PhysRig框架,将刚性骨架嵌入弹性软体体积,用MPM模拟物理,解决传统方法问题,在多角色、多物种评测中表现优,还能跨物种动作迁移。>阅读原文

MIT新研究有望解决大模型训练不稳定问题

MIT团队创造Lipschitz Transformer,通过谱正则化解决大模型训练不稳定问题。他们对比方法权衡,发现Muon+奇异值裁剪效果佳,工作开源,有望让AI训练更简单稳定。>阅读原文

OpenAI等:CoT监控是AI安全新机遇

OpenAI等联合发文,指出高级Agentic AI不透明有风险,而推理模型用自然语言推理让CoT监控成监督利器,可检测不当行为、发现早期信号等,但训练方式等因素或使监控性下降。>阅读原文

REST框架:大模型压力测试,DeepSeek性能暴跌

上海人工智能实验室等团队设计REST框架对超30个主流推理模型测试。发现顶级模型在“高压”下性能暴跌,不同参数模型性能差异明显,还揭示推理不良行为,为评测提供新范式。>阅读原文

KAUST:视频秒变游戏模型新方法诞生

KAUST团队提出V2M4方法,可从单目视频直接生成4D网格动画,无需NeRF/高斯点后处理。构建多阶段流程,平均每帧约60秒,在重建质量、效率和泛化能力上优势明显。>阅读原文

SRO赋能Qwen - 2.5 - VL推理性能飙升

研究团队:多模态大型语言模型推理能力扩展遇阻,提出SRO三阶段训练框架,用其优化Qwen - 2.5 - VL,ReVisual - R1推理性能平均提升16.8%。>阅读原文

厦大&腾讯优图:AIGI - Holmes检测AI生成图像

厦大与腾讯优图团队提出AIGI - Holmes方法检测AI生成图像。它有双视觉编码器等创新点,解决数据稀缺等问题。实验显示其在检测、解释能力及鲁棒性评估上超现有方法,但存在幻觉等局限。>阅读原文

MIRIX:让AI记忆性能飙升、存储大减

MIRIX多智能体记忆系统解决AI记忆难题,突破文本限制融入多模态体验。在ScreenshotVQA和LOCOMO测试中,比RAG性能升35%、存储减99.9%,远超现有基线。>阅读原文

    </p>    

官网:www.AiReadingHub.com

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

OpenAI GPT-5 AI技术 具身智能 AI安全
相关文章