AI Daily | AI日报：谷歌推 Gemini 2.5 Deep Think 模型助力数学研究; The Information：揭秘OpenAI GPT

All in AI，看见未来。每天精选最值得读的AI文章，帮你筛掉时代的噪音。以简讯见广度，以深读见洞察。技术、趋势、思考，一站式掌握AI世界。欢迎关注公众号「AI Reading Hub」，获取更多AI资讯和技术文章。

2025-08-02 资讯日报

新闻资讯

谷歌推 Gemini 2.5 Deep Think 模型助力数学研究

谷歌：本周五向 Google AI Ultra 订阅用户推 Deep Think 功能，提供 Gemini 2.5 Deep Think 模型。它是 IMO 金牌模型变体，速度快，能并行思维，在多基准测试成绩优，还提升了安全性。>阅读原文

The Information：揭秘OpenAI GPT - 5研发困境

The Information指出，OpenAI开发GPT - 5坎坷，今年技术难题频现，o3性能增益散退。但GPT - 5在编程和驱动智能体上有提升，虽不及早期飞跃，改进仍重要，还在研发‘通用验证器’。>阅读原文

OpenAI难题多，GPT - 5转向实用改进

OpenAI遇难题，GPT - 4.5未达预期，GPT - 5重实用。公司有技术转化、人才流失等问题，还在和微软谈判，也在筹备IPO，未来发展待解。>阅读原文

谷歌 IMO 金牌模型，测试力压 Grok 4、o3

谷歌向 Ultra 用户推 Deep Think 功能，其 Gemini 2.5 Deep Think 模型获 IMO 金牌，能并行思维答题。在多领域及测试表现好，如 LiveCodeBench V6 和 HLE，但网友评价两极分化。>阅读原文

日本开发者打造 Hono，定义后 React 时代框架未来

开发者 Yusuke Wada 2021 年创建 Hono，它基于 Web 标准，可多运行时使用。与 Next.js 不同，Hono 轻量、专注服务器层，适合边缘网络。虽 HonoX 处 Alpha 阶段，但或指明后 React 时代框架方向。>阅读原文

OpenAI 开源模型泄露六大技术细节

据爆料，OpenAI 或推两款开源模型，1200 亿参数 MoE 与 200 亿参数稠密模型，专注文本。采用 Float4 训练、SwiGLU 激活函数等技术，还融合 Llama/Mixtral 特点，优化不少。>阅读原文

Anthropic：OpenAI用Claude，违反条款！

Anthropic切断OpenAI对Claude API访问，因OpenAI技术人员大规模用Claude Code为GPT - 5做准备，违反服务条款。此前Anthropic也有类似操作，网友看法多样，AI模型公司大战开启。>阅读原文

产品应用

黄益贺：Sub - agents是Claude Code关键功能

黄益贺：Claude Code新功能Sub - agents超好用，能创建多个专精Agent，有独立上下文窗口，配置灵活可组工作流，创建简单，比社区项目更优，是Claude Code迄今最重要功能。>阅读原文

Dia更新：技能库与研究功能惊艳登场

池建强：Dia 连更两版，推出 Skills Gallery 和 Research 功能。前者像 App Store，降低开发使用门槛；后者有深度研究能力，重塑人机协作，是近期有分量的迭代。>阅读原文

谷歌IMO金牌模型上线，推理性能超o3、Grok 4

谷歌拿下IMO金牌的Gemini 2.5 Deep Think在Gemini App上线，速度和实用性提升。仅Ultra用户可用，月费约1803元。推理性能超o3、Grok 4，有迭代开发等优势。>阅读原文

4K-Agent：低分辨率图像升4K利器

德克萨斯A&M等大学研究人员推出4K Agent，其多智能体架构可处理各类图像，将低分辨率图像提至4K高清。有高度可配置性，在多领域测试表现出色，能生成高质量恢复结果。>阅读原文

作业帮：K8S 大模型流量调度创新方案

作业帮技术团队：针对 Kubernetes 中大模型服务流量调度难题，推出含模型路由、并发控制等功能的模型网关方案，提升易用性、性能和稳定性，降低运维成本。>阅读原文

开源动态

Windows - MCP开源：AI助手操控实体电脑

痕小子：Windows - MCP开源，这一轻量级工具可让AI助手与Windows UI原生交互，实现点击、输入等操作，支持Windows 7 - 11，适用于办公、测试等多场景。>阅读原文

Qwen3再发新模型，性能效率双优

Qwen3团队爱用MoE，继之前模型后又发布Qwen3-Coder-30B-A3B-Instruct。此简化模型性能效率佳，有编码等关键增强功能，非思考模型输出快。>阅读原文

Deep Cogito 开源模型超 DeepSeek，成本低

Deep Cogito 开源四款混合推理模型，最大 671B MoE 性能超 DeepSeek v3 等。其核心方法迭代蒸馏与增强效率高，成本不到 350 万美元，还展现出图像推理的涌现能力。>阅读原文

算法论文

华为与港科大：多模态后训练SFT和RL协同困境

华为与香港科大研究指出，多模态视觉语言模型里，长思维链SFT和RL组合难协同。SFT强于难题、RL长于均衡，五种组合策略均失效，还给出实验发现与未来研究方向。>阅读原文

    </p>

官网：www.AiReadingHub.com