掘金 人工智能 07月18日 12:22
AI Daily | AI日报:AWS:破解Agentic AI落地难题; 谷歌MoR架构:或成Transformer杀手; 米哈游5亿成立新公司,AI布局野心大
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

本文汇集了近期AI领域的重磅资讯,聚焦于Agentic AI的落地挑战与AWS的解决方案,以及谷歌MoR架构对Transformer的潜在颠覆。同时,也关注了米哈游、OpenAI、苹果、特朗普政府在AI领域的积极布局和投入。此外,文章还探讨了OpenAI ChatGPT Agent的发布对创业赛道的影响,以及黄仁勋对中国AI发展的赞赏,Claude Code主创回归Anthropic的动态,Mistral AI的开源模型进展,Lovable和Beehiiv的融资与营收情况,Meta在人才争夺上的策略,以及OpenAI前员工的反思和人类选手战胜AI的编程竞赛。最后,文章还涵盖了人形机器人、谷歌搜索AI革新、思维链之父跳槽、AI女友、AI应用开发平台、数字身份、数据融合、AIGC视频创作、金融智能体、AI产品关键路径等多个方面,展现了AI技术的快速发展和广泛应用。

🚀 **Agentic AI落地加速,AWS提供关键支持**:尽管Agentic AI的落地面临挑战,但AWS通过推出Amazon Bedrock AgentCore等系列产品,以及升级存储与市场服务,为企业构建Agentic AI提供了强大的基础设施和解决方案,预示着2025年可能成为Agent元年。

💡 **谷歌MoR架构挑战Transformer地位**:谷歌推出的Mixture-of-Recursions(MoR)架构,通过参数共享与自适应计算的统一,在实验中展现出超越Transformer的性能和更高的计算效率,预示着AI架构可能迎来新的变革。

🏢 **科技巨头与政策推动AI发展**:米哈游成立新公司加码AI布局,OpenAI发布ChatGPT Agent引发创业界关注,苹果MLX框架适配CUDA以扩大生态,特朗普宣布巨额投资打造AI中心,这些都显示了企业和政府对AI技术发展的重视和投入。

🌐 **AI应用场景多元化,从办公到生活**:ChatGPT Agent的发布不仅提升了AI在工作和生活场景中的应用能力,也促使创业公司重新审视自身定位,而AI算姻缘App的成功则揭示了抓住用户情感需求的新变现模式,沃尔玛的AI应用开发平台也展示了企业级AI落地的实践。

🧠 **AI研究与开源生态持续繁荣**:从大模型在数学证明、土木工程图纸修改上的能力评测,到新的图像生成模型、数学定理证明模型、安全扫描工具的开源发布,以及对强化学习难题的解决,都体现了AI研究的深度和开源社区的活力。

All in AI,看见未来。 每天精选最值得读的AI文章,帮你筛掉时代的噪音。 以简讯见广度,以深读见洞察。 技术、趋势、思考,一站式掌握AI世界。欢迎关注公众号「AI Reading Hub」,获取更多AI资讯和技术文章。

2025-07-18 资讯日报

新闻资讯

AWS:破解Agentic AI落地难题

红杉美国合伙人预测2025年为AI agent元年,但Agentic AI落地难。AWS发布系列产品,如支持长时间运行负载的Amazon Bedrock AgentCore等,还升级存储与市场服务,或成企业构建选择。>阅读原文

谷歌MoR架构:或成Transformer杀手

谷歌推出Mixture-of-Recursions(MoR)架构,在单一框架实现参数共享与自适应计算统一。实验显示,其性能超Transformer,计算效率高、可扩展性强,网友猜测或改变AI规则。>阅读原文

米哈游5亿成立新公司,AI布局野心大

米哈游动作不断,5亿成立无定谷科技。其早涉足AI,有自研模型,创始人蔡浩宇创业成果《Whispers from the Star》试玩。还与马斯克的AI女友Ani互动,两款产品方向不同。>阅读原文

OpenAI发布ChatGPT Agent,Agent创业者慌了

OpenAI发布ChatGPT Agent,整合多种能力,支持网页浏览、代码运行等。新模型经强化训练,在多基准测试中表现超竞品和旧版。这或使初创公司转向垂类Agent赛道。>阅读原文

苹果MLX框架主动适配英伟达CUDA

苹果为扩大影响力,让MLX框架适配CUDA。因CUDA在AI开发占主导,生态强,开发者多,且不允许在非英伟达平台运行程序,苹果此举既合规,又能借势发展。>阅读原文

特朗普宣布900亿建宾夕法尼亚AI中心

特朗普:宣布超900亿美元投资,要将宾夕法尼亚州打造成美国AI核心。谷歌、黑石等积极参与,涉及数据中心、能源基建等项目,还强调“能源安全人工智能”理念,将创造大量工作岗位。>阅读原文

OpenAI发布ChatGPT Agent,创业赛道生变

OpenAI发布ChatGPT Agent,将思考与执行能力整合,工作生活场景皆适用。它优化后能力达SOTA,不过也有风险。这或重塑互联网,让Agent创业者重新审视自身竞争力。>阅读原文

黄仁勋:中国AI与电动汽车令人惊叹

黄仁勋认为中国供应链先进、AI发展快,H20芯片解禁后将满足需求。他称赞中国电动汽车,尊重对手,不担忧贸易限制。他鼓励年轻人投身AI,还分享多AI比对提问的方法。>阅读原文

Claude Code主创回归,Anthropic估值冲千亿

Claude Code主创跳槽后回归Anthropic。该公司正洽谈新一轮融资,目标估值1000亿美元。Claude Code表现出色,收入增长快,还将推分析仪表盘,Cursor收入增长也让Anthropic受益。>阅读原文

OpenAI推出ChatGPT Agent,能力升级但有风险

OpenAI发布ChatGPT Agent,实现通用智能体能力升级,可完成复杂任务,已向部分用户开放。它整合多能力、配工具,基准测试表现好。不过有安全风险,网友体验有亮点也指出待改进处。>阅读原文

OpenAI发布ChatGPT Agent,或为GPT-5前菜

OpenAI发布ChatGPT Agent,能完成多类任务,如生活、办公等。测试表现不错,但离人类能力有差距。它是GPT - 5前菜,从提示式转向委托式协作,重新定义人机交互,不过也有安全风险。>阅读原文

Mistral AI:Le Chat对标ChatGPT穷追不舍

欧洲AI初创公司Mistral AI很躁动,连发多个开源模型。还升级Le Chat,功能全对标ChatGPT。其语音模型Voxtral号称最佳,多方面超竞品,展现欧洲在大模型领域的追赶势头。>阅读原文

Lovable 融资 2 亿,Beehiiv 年收破 3000 万

Lovable 完成 2 亿美金 A 轮融资,活跃用户 230 万,ARR 近 9000 万美金。每月 10 万家创业公司在此成立。Beehiiv 年营收破 3000 万美金,创始人分享 20 条创业心得,如顾问用处不大等。>阅读原文

Meta重金抢人,难复制DeepSeek成功

Meta 扎克伯格重金招人,组建豪华 AI 战队。但组织天才协同才是关键,DeepSeek 团队小、扁平化却成功逆袭。Meta 组织惯性大,难复制其成功,AI 行业组织重构能力或更重要。>阅读原文

OpenAI发布ChatGPT Agent,智能体赛道生变

OpenAI发布ChatGPT Agent,可自主思考选工具完成复杂任务。CEO Sam Altman称其能力强但有风险,内置安全机制。测试成绩优异,网友期待体验,认为或推动生产力革命。>阅读原文

OpenAI前员工深度反思公司内外情况

OpenAI前员工:在极速扩张下,公司沟通、管理等面临挑战,文化独特,技术受Meta影响。Codex项目7周完成发布,成果显著。认为AGI竞赛在OpenAI、Anthropic和Google间展开。>阅读原文

人类选手Psycho击败OpenAI获编程冠军

AtCoder编程总决赛,OpenAI的OpenAI - AHC前期领先,后半程失误。人类选手Psycho两次反超夺冠。Psycho曾在OpenAI训练AI胜人类,今挑战老东家成功,网友调侃这或为人类最后一次胜利。>阅读原文

深谋科技:AI大会秀人形机器人核心技术

深谋科技将在2025世界人工智能大会展示新一代人形机器人核心技术,如传感、脑机交互等系统。其认为大模型有局限,明年将推通用具身智能世界模型。>阅读原文

谷歌搜索AI革新:代打电话还会谈价!

谷歌搜索负责人预告三大AI革新,集成Gemini 2.5 Pro、开放Deep Search功能,还有AI代打电话。此功能先在美国上线,全球将跟进,或重塑本地生活逻辑,也引发实用性讨论。>阅读原文

思维链之父跳槽Meta,泄AI未来天机

思维链之父Jason Wei从OpenAI跳槽Meta。他认为人生起步可模仿,站稳后要发挥独有优势。还指出AI领域验证非对称性重要,可验证任务终将被AI攻克。>阅读原文

马斯克征Grok男友名,开源AI女友已火

马斯克为Grok男性数字伴侣征名,网友Jackywine复刻开源3D版AI女友‘Bella’。他为其规划‘AI原生’演进路径,分三阶段让Bella从感知到有个性,最终实现主动陪伴。>阅读原文

OpenAI推出ChatGPT Agent,似AI打工人上线

OpenAI推出ChatGPT Agent,整合多项能力,Pro等用户可激活。它能完成复杂任务,工具集强大,性能在多测试超人类。不过,因能力强,OpenAI启动最高安全保障。>阅读原文

亚马逊云科技:重新定义AI Agent玩法

亚马逊云科技在纽约峰会聚焦AI Agent,发布企业级搭建工具包Amazon Bedrock AgentCore,还推出相关工具和功能。其认为AI Agent能提升企业效率,市场需求大,已给出投入生产新范式。>阅读原文

产品应用

亚马逊云科技:打造 Agent 落地「金铲子」

亚马逊云科技发力 Agentic AI,推出全新 AgentAI 方案。构建 AgentCore 架构,集成 12 家模型厂商;升级 Strands Agents SDK 到 V1.0;还推出 Kiro 等工具,助力企业 AI 战略落地。>阅读原文

OpenAI 发布 ChatGPT Agent,创业公司压力大

OpenAI 发布 ChatGPT Agent,融合多种能力,有端到端任务执行等亮点,性能出色。不过价格贵、有安全问题,或压缩创业公司空间,未来机会在专用 Agent 及开源框架。>阅读原文

海辛阿文:分享Midjourney动画制作技巧

海辛和阿文受X上Midjourney风格代码启发制作恐龙短片,分享制作技巧。介绍风格代码功能,讲述配色控制方法,还给出复杂动画prompt示例,推荐找代码的作者和网站。>阅读原文

AI算姻缘App狂赚200万,贩卖“希望”!

大厂为AGI、Agent烧钱,“AI算姻缘”App Starla和Astra却靠“GPT对话+AI生图+星盘概念”,20天赚超200万美金。它们抓住用户对“灵魂伴侣”的渴望,贩卖“希望”,提供了新变现方向。>阅读原文

沃尔玛:揭秘 AI 应用开发平台玩法

沃尔玛披露 AI 应用平台 Walmart Element 细节,它采用“装配线”开发模式,整合数据资源,能快速构建部署应用。展示排班等典型应用,其 2022 年推出,自主构建策略对其他公司有借鉴意义。>阅读原文

OpenAI发布ChatGPT智能体,AI跃升为“真助手”

OpenAI发布ChatGPT智能体,融合网站交互、信息整合与对话能力,能智能选路径完成任务。性能领先,有安全措施。今日部分用户可体验,这或是范式转变。>阅读原文

CopilotKit实战:生成式UI与人类参与流程

文章延续Demo探索CopilotKit应用,包括生成式UI和HITL。前者能动态生成UI元素,后者引入人工决策。CopilotKit降低AI融合门槛,前后端职责分离,有望成智能体人机交互标准。>阅读原文

奥特曼发布ChatGPT「统一智能体」

OpenAI发布ChatGPT agent,融合三大技术,可自主办公,在多基准测试破纪录。2025年将成AI杠杆,让小团队创造大价值,重塑企业架构,开启人机协作新时代。>阅读原文

Second Me:重新定义AI时代数字身份

2025年个人AI分身大规模应用,Second Me成热门开源项目。创始人提出为个体打造专属AI代言人,有保留、放大、连接三价值维度。其聚焦个体数字身份,有望成人机协作信任基础。>阅读原文

甲骨文吴承杨:AI 时代数据融合至关重要

甲骨文吴承杨称 AI 放大数据优势,数据多模融合是大势,Oracle 以一体化架构解决问题。嵇小峰表示企业构建 Agent AI 要关注数据访问需求和安全,还提及向量处理和数据集成等要点。>阅读原文

首钢园活动课:AIGC掀起视频创作效率革命

7月16日晚,首钢园举办“AI视频生成与应用”活动课。达人展示前沿AI平台案例,教学涵盖知识库、工作流搭建等。讲师剖析行业趋势,指出AIGC未来将更多样,降低制作门槛。>阅读原文

00后团队推A股金融智能体FinGenius

00后天才团队发布FinGenius,为A股金融博弈智能体应用。它解决通用AI“水土不服”问题,16个智能体协作,30秒出报告。团队要重塑金融行业,分短期、中期、长期推进计划。>阅读原文

Qwen3-Embedding:高效AI产品关键路径揭秘

文章介绍阿里巴巴 Qwen3-Embedding,它功能多样、成本低,支持多语言。给出在 PAI 和百炼的使用方法,对比它和 LLM,显示其低延迟、低成本优势,还提及工程链路优化技巧。>阅读原文

推荐文章

CUTLASS CuTe:Swizzle模板参数取值分析

文章聚焦CUTLASS CuTe中Swizzle<B, M, S>模板参数选取。以(8, 32):(32, 1)为例,分析M、S与指令及内存结构关系,B避免冲突。给出不同Layout参数取值,方法具扩展性。>阅读原文

Hippocratic AI:估值 16 亿的 AI 护士破局者

Hippocratic AI 针对全球护理短缺,自研底层架构打造多 Agent 系统。产品临床满意度高,已完成多轮融资。但商业化受 AI 能力和人工监督限制,未来或提升渗透率,也可能被并购。>阅读原文

用房价预测入门机器学习全流程

文章围绕房价预测展开,阐述算法工程师开发模型全流程。介绍线性回归等模型,用均方误差评估,经调优、评估后,可从数据、特征和模型层面优化,还提及部署、监控与迭代,助开发者入门。>阅读原文

解析MRAG文档解析与索引关键技术

文章介绍MRAG 5项关键技术之一解析、索引。多模态文档分三类,解析方法有基于提取和表示两种。基于提取的方法有局限,如耗时、易丢信息、错误会传播。>阅读原文

开源动态

500美元!华人团队模型重构视频生成范式

香港城市大学等团队推出Pusa V1.0图像 - 视频生成模型,引入VTA机制,用低成本微调超越同类模型达SOTA。VTA让帧独立演化,使视频动态连贯自然,还解锁多任务能力。>阅读原文

Goedel - Prover - V2:8B参数暴击671B模型

普林斯顿等八大机构推出Goedel - Prover - V2,在多个数学基准测试夺冠,小参数8B版击败671B的DeepSeek - Prover,采用分层数据合成等技术,计算开销可控。>阅读原文

普林斯顿团队推最强开源数学定理证明模型

普林斯顿大学牵头多机构推出 Goedel-Prover-V2 模型。32B 旗舰模型性能大幅超越前代 SOTA,8B 小模型特定基准表现相当。有三项创新,团队公开模型与数据集,助力开源研究。>阅读原文

Trivy:研发团队必备开源安全扫描工具

Trivy是定位清晰、性能优越的开源安全扫描工具,支持多目标、多维扫描,速度快、集成灵活。能用于DevSecOps等流程,相比传统工具更轻量灵活,是DevSecOps团队首选。>阅读原文

算法论文

Evaluation Agent:视觉生成模型评估新范式

上海人工智能实验室与南洋理工大学团队研发 Evaluation Agent,入选 ACL 2025 Oral 论文。它可按需评估,效率高、可解释,未来将扩展评估能力、优化机制并迈向智能推荐。>阅读原文

斯坦福等团队提出大模型数学证明评测标准

斯坦福等团队针对大语言模型数学证明能力提出新思路,构建IneqMath数据集和‘AI数学裁判系统’。研究发现模型‘答案准’不代表‘推得对’,并给出自我批判和定理提示两个提升准确率的办法。>阅读原文

Google DeepMind:递归语言模型性能超传统

Google DeepMind研究者设计语言模型,处理语句时能判断关键单词深度递归,用“路由器”节省计算资源,同等成本下表现超传统模型,文中还介绍其他动态算力分配思路。>阅读原文

DrafterBench评测:大模型下工地能力待提升

加拿大麦吉尔大学等团队推出DrafterBench评估基准,评测主流大模型在土木工程图纸修改任务的表现。结果显示模型有一定能力,但整体水平未达工程一线要求,后续将拓展更多工程场景。>阅读原文

西湖大学:新算法破解流体力学建模难题

西湖大学冯浩东、范迪夏等提出RPLPO和PIPO算法。RPLPO解决部分观测下PDE loss误差,PIPO应对不准确物理信息。实验显示算法提升泛化与预测精度,未来将探索多物理场耦合等问题。>阅读原文

Google提出Concordia构建多智能体游戏引擎

Google等提出Concordia,打破传统游戏逻辑,以AI驱动的智能体当GM。基于「实体 - 组件」架构,工程师造组件,设计师组合用,能满足评估、戏剧、模拟等多种生成式AI使用需求。>阅读原文

Bind-Your-Avatar:免剪辑生成多角色对话视频

研究人员提出Bind-Your-Avatar框架,通过细粒度嵌入路由绑定语音与角色,实现音画同步。还构建MTCC数据集和基准测试,实验表明其在身份保真和音画同步上优于现有方法,后续将开源。>阅读原文

Oasis:仅靠图像实现多模态指令数据合成

同济大学等研究者提出 Oasis 多模态指令数据合成方法,仅靠图像生成数据,打破传统模式。开源代码库 MM - INF,实验表明其数据多样、可扩展,能显著提升 MLLM 性能,还能回收利用丢弃数据。>阅读原文

谷歌新架构MoR:有望成Transformer杀手

谷歌DeepMind发布新架构MoR,在递归Transformer基础上进化。它统一实现参数共享、计算路由和递归级缓存,兼顾性能与效率。实验表明推理吞吐量提升,少参数也能优于基线模型,但能否成“Transformer杀手”存疑。>阅读原文

AI4Research:科学研究AI应用全面综述

该综述指出,AI4Research可分五个关键领域,如科学理解、学术调查等,各领域有细分任务。AI能在研究全流程发挥多样作用,还应用于自然、应用、社会科学等多学科。>阅读原文

FreeMorph:一步到位的图像morphing方法

南洋理工大学等团队提出FreeMorph方法解决图像morphing难题。它改进扩散模型注意力机制,有引导感知球面插值和步骤导向变化趋势两创新,实验显示能处理多样图像,超越现有技术,但有一定局限。>阅读原文

ICLR论文解决强化学习两大「大坑」

Mila 实验室两篇 ICLR 2025 论文解决强化学习两大难题。一篇提出交错推理框架消除无动作遗憾,另一篇引入并行计算与时序跳跃连接减少延迟遗憾,结合使用能推动其在关键领域应用。>阅读原文

一个标点竟能骗倒LLM裁判!

研究发现:仅一个标点或推理开场白就能欺骗LLM裁判,在顶级模型中攻击成功率达80%,致强化学习训练崩溃。提出的Master - RM模型FPR近乎0%,保持通用裁判能力,为RLVR提供高鲁棒性方案。>阅读原文

广义智能体理论:通向「万物理论」新路径

刘锋团队提出广义智能体理论,认为物理、生命、AI系统都是智能体,引力等或源于「智能场」。该理论为统一物理理论提供新思路,虽待验证,但有望成探索「万物理论」新路径。>阅读原文

    </p>    

官网:www.AiReadingHub.com

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

AI Agentic AI ChatGPT Transformer 人工智能技术
相关文章