AI Daily | AI日报：AWS：破解Agentic AI落地难题; 谷歌MoR架构：或成Transformer杀手; 米哈游5亿成立新公司，AI布局野心大

All in AI，看见未来。每天精选最值得读的AI文章，帮你筛掉时代的噪音。以简讯见广度，以深读见洞察。技术、趋势、思考，一站式掌握AI世界。欢迎关注公众号「AI Reading Hub」，获取更多AI资讯和技术文章。

2025-07-18 资讯日报

新闻资讯

AWS：破解Agentic AI落地难题

红杉美国合伙人预测2025年为AI agent元年，但Agentic AI落地难。AWS发布系列产品，如支持长时间运行负载的Amazon Bedrock AgentCore等，还升级存储与市场服务，或成企业构建选择。>阅读原文

谷歌MoR架构：或成Transformer杀手

谷歌推出Mixture-of-Recursions（MoR）架构，在单一框架实现参数共享与自适应计算统一。实验显示，其性能超Transformer，计算效率高、可扩展性强，网友猜测或改变AI规则。>阅读原文

米哈游5亿成立新公司，AI布局野心大

米哈游动作不断，5亿成立无定谷科技。其早涉足AI，有自研模型，创始人蔡浩宇创业成果《Whispers from the Star》试玩。还与马斯克的AI女友Ani互动，两款产品方向不同。>阅读原文

OpenAI发布ChatGPT Agent，Agent创业者慌了

OpenAI发布ChatGPT Agent，整合多种能力，支持网页浏览、代码运行等。新模型经强化训练，在多基准测试中表现超竞品和旧版。这或使初创公司转向垂类Agent赛道。>阅读原文

苹果MLX框架主动适配英伟达CUDA

苹果为扩大影响力，让MLX框架适配CUDA。因CUDA在AI开发占主导，生态强，开发者多，且不允许在非英伟达平台运行程序，苹果此举既合规，又能借势发展。>阅读原文

特朗普宣布900亿建宾夕法尼亚AI中心

特朗普：宣布超900亿美元投资，要将宾夕法尼亚州打造成美国AI核心。谷歌、黑石等积极参与，涉及数据中心、能源基建等项目，还强调“能源安全人工智能”理念，将创造大量工作岗位。>阅读原文

OpenAI发布ChatGPT Agent，创业赛道生变

OpenAI发布ChatGPT Agent，将思考与执行能力整合，工作生活场景皆适用。它优化后能力达SOTA，不过也有风险。这或重塑互联网，让Agent创业者重新审视自身竞争力。>阅读原文

黄仁勋：中国AI与电动汽车令人惊叹

黄仁勋认为中国供应链先进、AI发展快，H20芯片解禁后将满足需求。他称赞中国电动汽车，尊重对手，不担忧贸易限制。他鼓励年轻人投身AI，还分享多AI比对提问的方法。>阅读原文

Claude Code主创回归，Anthropic估值冲千亿

Claude Code主创跳槽后回归Anthropic。该公司正洽谈新一轮融资，目标估值1000亿美元。Claude Code表现出色，收入增长快，还将推分析仪表盘，Cursor收入增长也让Anthropic受益。>阅读原文

OpenAI推出ChatGPT Agent，能力升级但有风险

OpenAI发布ChatGPT Agent，实现通用智能体能力升级，可完成复杂任务，已向部分用户开放。它整合多能力、配工具，基准测试表现好。不过有安全风险，网友体验有亮点也指出待改进处。>阅读原文

OpenAI发布ChatGPT Agent，或为GPT-5前菜

OpenAI发布ChatGPT Agent，能完成多类任务，如生活、办公等。测试表现不错，但离人类能力有差距。它是GPT - 5前菜，从提示式转向委托式协作，重新定义人机交互，不过也有安全风险。>阅读原文

Mistral AI：Le Chat对标ChatGPT穷追不舍

欧洲AI初创公司Mistral AI很躁动，连发多个开源模型。还升级Le Chat，功能全对标ChatGPT。其语音模型Voxtral号称最佳，多方面超竞品，展现欧洲在大模型领域的追赶势头。>阅读原文

Lovable 融资 2 亿，Beehiiv 年收破 3000 万

Lovable 完成 2 亿美金 A 轮融资，活跃用户 230 万，ARR 近 9000 万美金。每月 10 万家创业公司在此成立。Beehiiv 年营收破 3000 万美金，创始人分享 20 条创业心得，如顾问用处不大等。>阅读原文

Meta重金抢人，难复制DeepSeek成功

Meta 扎克伯格重金招人，组建豪华 AI 战队。但组织天才协同才是关键，DeepSeek 团队小、扁平化却成功逆袭。Meta 组织惯性大，难复制其成功，AI 行业组织重构能力或更重要。>阅读原文

OpenAI发布ChatGPT Agent，智能体赛道生变

OpenAI发布ChatGPT Agent，可自主思考选工具完成复杂任务。CEO Sam Altman称其能力强但有风险，内置安全机制。测试成绩优异，网友期待体验，认为或推动生产力革命。>阅读原文

OpenAI前员工深度反思公司内外情况

OpenAI前员工：在极速扩张下，公司沟通、管理等面临挑战，文化独特，技术受Meta影响。Codex项目7周完成发布，成果显著。认为AGI竞赛在OpenAI、Anthropic和Google间展开。>阅读原文

人类选手Psycho击败OpenAI获编程冠军

AtCoder编程总决赛，OpenAI的OpenAI - AHC前期领先，后半程失误。人类选手Psycho两次反超夺冠。Psycho曾在OpenAI训练AI胜人类，今挑战老东家成功，网友调侃这或为人类最后一次胜利。>阅读原文

深谋科技：AI大会秀人形机器人核心技术

深谋科技将在2025世界人工智能大会展示新一代人形机器人核心技术，如传感、脑机交互等系统。其认为大模型有局限，明年将推通用具身智能世界模型。>阅读原文

谷歌搜索AI革新：代打电话还会谈价！

谷歌搜索负责人预告三大AI革新，集成Gemini 2.5 Pro、开放Deep Search功能，还有AI代打电话。此功能先在美国上线，全球将跟进，或重塑本地生活逻辑，也引发实用性讨论。>阅读原文

思维链之父跳槽Meta，泄AI未来天机

思维链之父Jason Wei从OpenAI跳槽Meta。他认为人生起步可模仿，站稳后要发挥独有优势。还指出AI领域验证非对称性重要，可验证任务终将被AI攻克。>阅读原文

马斯克征Grok男友名，开源AI女友已火

马斯克为Grok男性数字伴侣征名，网友Jackywine复刻开源3D版AI女友‘Bella’。他为其规划‘AI原生’演进路径，分三阶段让Bella从感知到有个性，最终实现主动陪伴。>阅读原文

OpenAI推出ChatGPT Agent，似AI打工人上线

OpenAI推出ChatGPT Agent，整合多项能力，Pro等用户可激活。它能完成复杂任务，工具集强大，性能在多测试超人类。不过，因能力强，OpenAI启动最高安全保障。>阅读原文

亚马逊云科技：重新定义AI Agent玩法

亚马逊云科技在纽约峰会聚焦AI Agent，发布企业级搭建工具包Amazon Bedrock AgentCore，还推出相关工具和功能。其认为AI Agent能提升企业效率，市场需求大，已给出投入生产新范式。>阅读原文

产品应用

亚马逊云科技：打造 Agent 落地「金铲子」

亚马逊云科技发力 Agentic AI，推出全新 AgentAI 方案。构建 AgentCore 架构，集成 12 家模型厂商；升级 Strands Agents SDK 到 V1.0；还推出 Kiro 等工具，助力企业 AI 战略落地。>阅读原文

OpenAI 发布 ChatGPT Agent，创业公司压力大

OpenAI 发布 ChatGPT Agent，融合多种能力，有端到端任务执行等亮点，性能出色。不过价格贵、有安全问题，或压缩创业公司空间，未来机会在专用 Agent 及开源框架。>阅读原文

海辛阿文：分享Midjourney动画制作技巧

海辛和阿文受X上Midjourney风格代码启发制作恐龙短片，分享制作技巧。介绍风格代码功能，讲述配色控制方法，还给出复杂动画prompt示例，推荐找代码的作者和网站。>阅读原文

AI算姻缘App狂赚200万，贩卖“希望”！

大厂为AGI、Agent烧钱，“AI算姻缘”App Starla和Astra却靠“GPT对话+AI生图+星盘概念”，20天赚超200万美金。它们抓住用户对“灵魂伴侣”的渴望，贩卖“希望”，提供了新变现方向。>阅读原文

沃尔玛：揭秘 AI 应用开发平台玩法

沃尔玛披露 AI 应用平台 Walmart Element 细节，它采用“装配线”开发模式，整合数据资源，能快速构建部署应用。展示排班等典型应用，其 2022 年推出，自主构建策略对其他公司有借鉴意义。>阅读原文

OpenAI发布ChatGPT智能体，AI跃升为“真助手”

OpenAI发布ChatGPT智能体，融合网站交互、信息整合与对话能力，能智能选路径完成任务。性能领先，有安全措施。今日部分用户可体验，这或是范式转变。>阅读原文

CopilotKit实战：生成式UI与人类参与流程

文章延续Demo探索CopilotKit应用，包括生成式UI和HITL。前者能动态生成UI元素，后者引入人工决策。CopilotKit降低AI融合门槛，前后端职责分离，有望成智能体人机交互标准。>阅读原文

奥特曼发布ChatGPT「统一智能体」

OpenAI发布ChatGPT agent，融合三大技术，可自主办公，在多基准测试破纪录。2025年将成AI杠杆，让小团队创造大价值，重塑企业架构，开启人机协作新时代。>阅读原文

Second Me：重新定义AI时代数字身份

2025年个人AI分身大规模应用，Second Me成热门开源项目。创始人提出为个体打造专属AI代言人，有保留、放大、连接三价值维度。其聚焦个体数字身份，有望成人机协作信任基础。>阅读原文

甲骨文吴承杨：AI 时代数据融合至关重要

甲骨文吴承杨称 AI 放大数据优势，数据多模融合是大势，Oracle 以一体化架构解决问题。嵇小峰表示企业构建 Agent AI 要关注数据访问需求和安全，还提及向量处理和数据集成等要点。>阅读原文

首钢园活动课：AIGC掀起视频创作效率革命

7月16日晚，首钢园举办“AI视频生成与应用”活动课。达人展示前沿AI平台案例，教学涵盖知识库、工作流搭建等。讲师剖析行业趋势，指出AIGC未来将更多样，降低制作门槛。>阅读原文

00后团队推A股金融智能体FinGenius

00后天才团队发布FinGenius，为A股金融博弈智能体应用。它解决通用AI“水土不服”问题，16个智能体协作，30秒出报告。团队要重塑金融行业，分短期、中期、长期推进计划。>阅读原文

Qwen3-Embedding：高效AI产品关键路径揭秘

文章介绍阿里巴巴 Qwen3-Embedding，它功能多样、成本低，支持多语言。给出在 PAI 和百炼的使用方法，对比它和 LLM，显示其低延迟、低成本优势，还提及工程链路优化技巧。>阅读原文

开源动态

500美元！华人团队模型重构视频生成范式

香港城市大学等团队推出Pusa V1.0图像 - 视频生成模型，引入VTA机制，用低成本微调超越同类模型达SOTA。VTA让帧独立演化，使视频动态连贯自然，还解锁多任务能力。>阅读原文

Goedel - Prover - V2：8B参数暴击671B模型

普林斯顿等八大机构推出Goedel - Prover - V2，在多个数学基准测试夺冠，小参数8B版击败671B的DeepSeek - Prover，采用分层数据合成等技术，计算开销可控。>阅读原文

普林斯顿团队推最强开源数学定理证明模型

普林斯顿大学牵头多机构推出 Goedel-Prover-V2 模型。32B 旗舰模型性能大幅超越前代 SOTA，8B 小模型特定基准表现相当。有三项创新，团队公开模型与数据集，助力开源研究。>阅读原文

Trivy：研发团队必备开源安全扫描工具

Trivy是定位清晰、性能优越的开源安全扫描工具，支持多目标、多维扫描，速度快、集成灵活。能用于DevSecOps等流程，相比传统工具更轻量灵活，是DevSecOps团队首选。>阅读原文

算法论文

Evaluation Agent：视觉生成模型评估新范式

上海人工智能实验室与南洋理工大学团队研发 Evaluation Agent，入选 ACL 2025 Oral 论文。它可按需评估，效率高、可解释，未来将扩展评估能力、优化机制并迈向智能推荐。>阅读原文

斯坦福等团队提出大模型数学证明评测标准

斯坦福等团队针对大语言模型数学证明能力提出新思路，构建IneqMath数据集和‘AI数学裁判系统’。研究发现模型‘答案准’不代表‘推得对’，并给出自我批判和定理提示两个提升准确率的办法。>阅读原文

Google DeepMind：递归语言模型性能超传统

Google DeepMind研究者设计语言模型，处理语句时能判断关键单词深度递归，用“路由器”节省计算资源，同等成本下表现超传统模型，文中还介绍其他动态算力分配思路。>阅读原文

DrafterBench评测：大模型下工地能力待提升

加拿大麦吉尔大学等团队推出DrafterBench评估基准，评测主流大模型在土木工程图纸修改任务的表现。结果显示模型有一定能力，但整体水平未达工程一线要求，后续将拓展更多工程场景。>阅读原文

西湖大学：新算法破解流体力学建模难题

西湖大学冯浩东、范迪夏等提出RPLPO和PIPO算法。RPLPO解决部分观测下PDE loss误差，PIPO应对不准确物理信息。实验显示算法提升泛化与预测精度，未来将探索多物理场耦合等问题。>阅读原文

Google提出Concordia构建多智能体游戏引擎

Google等提出Concordia，打破传统游戏逻辑，以AI驱动的智能体当GM。基于「实体 - 组件」架构，工程师造组件，设计师组合用，能满足评估、戏剧、模拟等多种生成式AI使用需求。>阅读原文

Bind-Your-Avatar：免剪辑生成多角色对话视频

研究人员提出Bind-Your-Avatar框架，通过细粒度嵌入路由绑定语音与角色，实现音画同步。还构建MTCC数据集和基准测试，实验表明其在身份保真和音画同步上优于现有方法，后续将开源。>阅读原文

Oasis：仅靠图像实现多模态指令数据合成

同济大学等研究者提出 Oasis 多模态指令数据合成方法，仅靠图像生成数据，打破传统模式。开源代码库 MM - INF，实验表明其数据多样、可扩展，能显著提升 MLLM 性能，还能回收利用丢弃数据。>阅读原文

谷歌新架构MoR：有望成Transformer杀手

谷歌DeepMind发布新架构MoR，在递归Transformer基础上进化。它统一实现参数共享、计算路由和递归级缓存，兼顾性能与效率。实验表明推理吞吐量提升，少参数也能优于基线模型，但能否成“Transformer杀手”存疑。>阅读原文

AI4Research：科学研究AI应用全面综述

该综述指出，AI4Research可分五个关键领域，如科学理解、学术调查等，各领域有细分任务。AI能在研究全流程发挥多样作用，还应用于自然、应用、社会科学等多学科。>阅读原文

FreeMorph：一步到位的图像morphing方法

南洋理工大学等团队提出FreeMorph方法解决图像morphing难题。它改进扩散模型注意力机制，有引导感知球面插值和步骤导向变化趋势两创新，实验显示能处理多样图像，超越现有技术，但有一定局限。>阅读原文

ICLR论文解决强化学习两大「大坑」

Mila 实验室两篇 ICLR 2025 论文解决强化学习两大难题。一篇提出交错推理框架消除无动作遗憾，另一篇引入并行计算与时序跳跃连接减少延迟遗憾，结合使用能推动其在关键领域应用。>阅读原文

一个标点竟能骗倒LLM裁判！

研究发现：仅一个标点或推理开场白就能欺骗LLM裁判，在顶级模型中攻击成功率达80%，致强化学习训练崩溃。提出的Master - RM模型FPR近乎0%，保持通用裁判能力，为RLVR提供高鲁棒性方案。>阅读原文

广义智能体理论：通向「万物理论」新路径

刘锋团队提出广义智能体理论，认为物理、生命、AI系统都是智能体，引力等或源于「智能场」。该理论为统一物理理论提供新思路，虽待验证，但有望成探索「万物理论」新路径。>阅读原文

    </p>

官网：www.AiReadingHub.com