APPSO 14小时前
印度码农冒充AI骗取32亿?假瓜/黄仁勋驳斥AI取代半数白领论/苹果「炮轰」模型假思考,测试遭质疑|Hunt Good周报
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

本周的Hunt Good周报聚焦AI领域的最新进展,涵盖了迪士尼和环球影业起诉Midjourney的版权争议、Meta斥巨资收购Scale AI、Builder.ai伪装AI事件的澄清、Mattel与OpenAI合作开发AI玩具、苹果AI推理模型测试方法的争议、新版Siri的发布时间、特斯拉起诉前工程师窃取商业机密等。同时,也介绍了Dia浏览器、腾讯开源混元3D 2.1大模型、AMD与OpenAI合作发布AI芯片、Meta发布世界模型V-JEPA 2、OpenAI o3-pro推理模型发布、Mistral推出推理模型Magistral以及Veo 3生成的NBA总决赛广告。

🧑‍⚖️ 迪士尼和环球影业起诉Midjourney,指控其侵犯版权,这标志着IP巨头首次就AI侵权问题采取法律行动,引发了对AI生成内容版权问题的关注。

💰 Meta斥资143亿美元收购Scale AI,并招募其CEO加入Meta的AI团队,旨在加强其在AI领域的发展,并加速实现AGI(通用人工智能)的目标,与Google和OpenAI展开竞争。

🧸 Mattel与OpenAI合作,计划将生成式AI引入玩具制造行业,并开发AI驱动的产品,这预示着AI技术在传统行业的应用,以及玩具和游戏玩法方式的创新。

🍎 苹果的AI推理模型论文引发争议,研究员指出苹果的测试方法存在问题,认为AI模型并非不会推理,而是受到表达方式的限制,揭示了大模型推理能力的局限性。

🐧 腾讯开源混元3D 2.1大模型,并降低了开发门槛,开源并且支持消费级显卡部署,轻游梦工坊使用混元3D在多条美术管线完成提效,道具管线制作周期由 2 天/个降低至 0.2 天/个。

发现明日产品的 2025-06-15 11:56 广东

8 条新鲜资讯 5个有用工具 1 个有趣案例 3 个鲜明观点

欢迎收看最新一期的 Hunt Good 周报!

在本期内容你会看到:

8 条新鲜资讯5个有用工具1 个有趣案例3 个鲜明观点

Hunt for News|先进头条

🧑‍⚖️ 迪士尼和环球影业起诉 Midjourney,指控其生成侵权角色图像

6 月 12 日,迪士尼和环球影业对 Midjourney 提起诉讼,指控其生成侵犯版权的角色,包括《怪物史莱克》中的史莱克、《星际大战》中的达斯·维达、《玩具总动员》中的巴斯光年等著名角色。

诉状称,Midjourney 在几乎没有任何原创投入的情况下,如同一个「虚拟自动售货机」,不断生成带有版权的角色形象。并且,Midjourney 不仅生成了这些角色的图像,还将其用于宣传推广。

此外,诉讼中还提到,Midjourney 已经开始训练其视频生成工具,预计将生成和传播包含这些版权角色的视频,从而进一步加剧侵权问题。

因此,迪士尼和环球影业强调这是一起严重的版权侵权案件,要求陪审团审理此案,虽然这并非第一起指控 AI 公司侵犯版权的案件,但却是 IP 巨头首次就此类问题采取法律行动。

🔗 https://www.theverge.com/ai-artificial-intelligence/685433/disney-universal-sue-midjourney-copyright-infringement

💰 Meta 斥资 143 亿美元收购 Scale AI 49% 股份,聘请其 CEO 引领 AI 重组

Meta 已完成对 Scale AI 的 143 亿美元投资,并招募了该公司 CEO Alexandr Wang 加入 Meta 的 AI 团队,进一步加强其 AI 发展。

Meta 将投资 143 亿美元,获得 Scale 49% 的股份,但不具备投票权。

据彭博社和纽约时报消息,扎克伯格对 Meta 旗下的 AI 表现感到不满,正在组建一个名为「superintelligence」(超级智能)的专家团队,以实现 AGI(通用人工智能)。

Wang 将加入 Meta 的「超级智能」团队,专注于打造类人 AI(人工通用智能),并继续在 Scale 担任董事会成员。

扎克伯格认为 Meta 能够实现 AGI 并且在该领域超越其他科技公司,并且 Meta 将会在实现 AGI 的同时,将该技术融入到旗下的产品中,例如 Meta 聊天机器人和目前火热的 Ray-Ban Meta 智能眼镜。

报道指出,扎克伯格计划为新团队招聘 50 人,并且人选基本由他亲自招募。据知情人士透露,扎克伯格还安排该团队的办公位置能靠他本人近一点。

Meta 已向 OpenAI、Google 等 AI 领先公司的数十位研究人员发出邀请,并且向该批研究人员提供价值数亿至数十亿的薪资方案。据悉,目前已有部分人员同意加入。

另外,虽然 Scale 不专注于大型语言模型,它为 AI 巨头提供 AI 数据服务,并帮助企业和政府开发定制化 AI 应用。Scale AI 近年来业绩强劲,预计今年收入达到 20 亿美元。此次投资使 Meta 在 AI 发展上有望迎头赶上 Google 和 OpenAI。

根据最新的消息,原计划今年向 Scale 支付约 2 亿美元用于获取训练 Gemini 所需的人工数据,在 Meta 宣布入股 Scale AI 后,Google 已开始接洽其他数据服务商,原因出于对数据安全与竞争情报外泄的担忧。

而 OpenAI 首席财务官表示,在 Meta 交易后将继续与 Scale 合作。「我们不希望让整个生态系统冻结,因为收购是迟早要发生的事情。如果我们彼此排斥,我认为这反而会放慢创新的步伐。」

🔗 https://www.reuters.com/business/google-scale-ais-largest-customer-plans-split-after-meta-deal-sources-say-2025-06-13/

👊 「Builder.ai 用 700 名工程师伪装 AI」的报道为假新闻

社交媒体的热门话题—— 印度公司 Builder.ai 雇用了 700 名工程师来伪装成 AI 产品,最近被重新澄清为虚假报道。

Builder.ai 创立于 2016 年,曾宣称其产品为无代码平台,用户可以像点披萨一样轻松使用名为 Natasha 的 AI 助手构建应用,成功获得 4.5 亿美元投资(折合约人民币 32 亿元)。今年 5 月份,该公司因财务管理不善、收入虚报和债务危机而宣告破产。

随之,许多媒体报道称,Builder.ai 的产品是由 700 名印度工程师手动开发的,并非由人工智能完成。

针对这一新闻,《The Pulse》采访了几位曾在 Builder.ai 工作的工程师,确认了上述新闻并不属实。实际情况是,Builder.ai 使用 15 名工程师和大型语言模型如 GPT 和 Claude 来开发代码生成工具 Natasha,而不是人工工程师伪装成 AI。

同时,《The Pulse》也做了一个思想实验来分析「 700 名工程师伪造 AI 」的可行性。发现「延迟」和「响应速度」是核心问题:若系统需要 10 到 30 分钟才能完成一个简单任务,用户显然不会认为这是一套高效的 AI 系统。

为解决这些问题,开发者需要依赖 LLM 来提高效率,而非完全依赖人工开发,因此「伪造 AI」的做法是不切实际的。

🔗 https://newsletter.pragmaticengineer.com/p/the-pulse-137

🧸 让芭比娃娃开口说话?玩具巨头美泰将与 OpenAI 合推首款 AI 产品

Mattel 和 OpenAI 宣布达成合作,计划将生成式 AI 引入玩具制造行业以及其不断扩展的知识产权再包装流程中。

这标志着 OpenAI 在首次与玩具制造商合作。此举与 OpenAI 的战略一致,旨在将其技术嵌入更多行业,并可能为其在 Mattel 的娱乐业务拓展提供立足点。

Mattel 近年来不断扩展业务,2023 年推出的《Barbie》电影成为爆款,并在开发更多基于经典玩具的电影,如 Hot Wheels、Polly Pocket、Barney 等。同时,Mattel 还进入了数字游戏领域,并计划于 2026 年发布首款自研游戏。

尽管合作细节尚未透露,Mattel 和 OpenAI 计划在今年晚些时候发布首个「AI 驱动的产品」,旨在通过安全且负责任的方式增强粉丝互动。

此外,Mattel 员工也将使用 OpenAI 的工具,如 ChatGPT Enterprise,来提升产品开发和创意构思。Mattel 表示,AI 技术将帮助公司拓展品牌影响力,并创新玩具和游戏的玩法方式。

这项合作为 Mattel 的品牌注入了新一代技术,是否意味着 ChatGPT 支持的 Barbie 或更快的剧本创作,未来将揭晓。

🔗 https://techcrunch.com/2025/06/12/openai-and-barbie-maker-mattel-team-up-to-bring-generative-ai-to-toy-making-and-content-creation/

🍎 苹果论文「炮轰」AI 推理模型不懂思考,测试方法遭质疑

苹果不久前发布了一篇备受关注的研究论文,标题是《思考的错觉》(The Illusion of Thinking)。

文章指出,即使是最强大的 AI 模型,在面对复杂任务时也会「推理崩溃」,指出 AI 推理模型未必是真思考。但现在,来自 Open Philanthropy 的研究员 Alex Lawsen 对此提出了强烈反驳。

Lawsen 撰写了一篇名为《「思考的错觉」的错觉》的论文,明确指出:苹果所谓的「推理失败」,其实是误把技术限制和测评方法的问题当成了 AI 本身的问题。有趣的是,Anthropic Claude Opus 模型也被列为这篇质疑论文的第一作者「 C. Opus」。

Lawsen 的反驳可以归结为三点:

首先,苹果忽略了 Token(输出字数)限制。在「汉诺塔」这类需要列出大量步骤的测试中,Claude 等模型确实中途停下了,但那是因为它们到了输出上限,有模型甚至明确表示:「我还可以继续,但为了节省 token 在这里先停。」

其次,苹果在「过河难题」测试中使用了数学上无解的题目,例如让 6 组角色过河,但只给了一条无法容纳所有人的船。模型识别出这些题目无解并选择不作答,却被标记为「失败」。

再者,苹果的评估方法过于死板,只认「有没有完整答案」,而无法判断模型是「真的不会」,还是「被系统卡住没法继续写」。

为了验证自己的观点,Lawsen 让模型用代码来解题,而不是逐条写出全部步骤。例如在汉诺塔问题中,他让 Claude、Gemini 和 OpenAI 的 o3 模型写一个递归算法。

结果显示:这些模型不仅能正确写出程序,甚至能轻松解决 15 个圆盘的河内塔,远远超过苹果论文中声称模型「完全崩溃」的范围。Lawsen 的结论是,AI 模型并不是不会推理,而是被限制了表达方式。一旦换个方式给它「发挥空间」,它就能解决看起来很复杂的问题。

不过,著名的 LLM 批评者、知名学者 Gary Marcus 也发表了苹果的论文一些看法,指出目前主流模型通过扩大规模「堆智力」的方式已难以为继。其他观点如下:

Token 限制不能解释一切,模型在简单任务也会失败。

对论文作者「是实习生」的质疑,是无效的人身攻击,论文由多个经验丰富的作者联合完成,第一作者虽为实习生,但也是一名活跃的博士研究者。

有迹象表明更大模型在某些任务中表现更好,但无法提前预知「多大才够」,性能波动大,稍微改变任务复杂度或形式就可能失败,无法作为稳定解决方案。

在某些情况下,模型能通过写代码解决任务,这是神经符号 AI 的胜利。但苹果论文探讨的是模型是否具备「自主推理和解题」的能力,而非是否会调用已有代码库,就像学生会用数学软件一样,并不意味着他理解了积分原理。

即便只有四个案例,其中一个(汉诺塔)有瑕疵,但泛化能力差的问题,业界其实早已知道,这篇论文与已有的大量研究结论一致,强化了对大模型推理局限的观察。

Gary Marcus 原文:https://garymarcus.substack.com/p/seven-replies-to-the-viral-apple

论文地址:https://arxiv.org/pdf/2506.09250

🎤 新版 Siri 预计 2026 年春季推出

日前,苹果软件工程高级副总裁 Craig Federighi 和苹果全球营销高级副总裁 Greg Joswiak(简称 Joz)接受《Tom‘s Guide》采访,两位副总裁在节目中透露了更多苹果 AI 开发细节。

面对备受诟病的 Siri,Craig 也再一次承认了「高估研发能力」。其透露,内部讨论了两个版本的 Siri 架构,其中受架构限制,团队深知无法满足用户需求,因此不得不放弃原计划的 V1 版本,转向 V2 版本。

对于 V2 版本,Craig 并没有透露太多信息,但留下了「将准备宣布推送的日期了,你们都准备好体验它吧!」。

彭博社记者 Mark Gurman 也援引知情人士消息称,苹果计划将新版 Siri 定在 2026 年春季发布,跟随 iOS 26.4 版本一同登场。

报道透露,新版 Siri 将接入用户个人数据和屏幕活动,以便更好地满足 Siri 获取用户需求。

而在《Tom‘s Guide》采访中,Joz 也表示,苹果 AI 的任务是通过理解用户提供的上下文内容,去自主匹配哪些功能的体验最合适,并尽所能发挥作用。

同时他也强调,目前 Apple Intelligence 中展现的功能,并非苹果终点。据他透露,苹果希望让名为「智能」的软件消失,但能让 AI 助力用户把每天的事情变得更好。

值得一提的是,苹果在今年 WWDC25 上,宣布推出全新 API「Foundation Models Framework」,允许第三方开发者调用 Apple Intelligence 核心的大型语言模型(LLM),并将其集成到自家应用中。

🔗 https://www.bloomberg.com/news/articles/2025-06-12/apple-targets-spring-2026-for-release-of-delayed-siri-ai-upgrade?srnd=phx-ai

📜 特斯拉起诉前 Optimus 工程师窃取商业机密

特斯拉于 6 月 12 日起诉前工程师 Zhongjie 「Jay」 Li,指控他窃取了与特斯拉人形机器人项目 Optimus 相关的商业机密,并利用这些机密创办了竞争对手公司 Proception。

诉状称,Li 在 2022 年 8 月至 2024 年 9 月期间,使用两部个人智能手机下载了有关特斯拉开发的「先进机器人手部传感器」的机密信息,随后用于创建自己的机器人手部初创公司 Proception。

诉状还指出,在离职前的几个月,Li 在工作电脑上研究了「人形机器人手部」的信息,并查找了与风险投资和创业资金相关的资料。

Proception 网站称,公司旨在「通过打造世界上最先进的人形手部,彻底改变人类与机器人之间的互动」。

特斯拉的 Optimus 机器人项目自 2021 年宣布后进展缓慢,尽管最初计划于 2023 年发布,Elon Musk 已表示该机器人将于 2026 年上市。

🔗 https://techcrunch.com/2025/06/12/the-meta-ai-app-is-a-privacy-disaster/

🔍 Dia 面向已有 Arc 用户开放测试版

The Browser Company 推出的以 AI 为核心的全新浏览器现已对 Arc 会员开放。(体验链接:https://www.diabrowser.com/)

虽然 Dia 还处于测试阶段,仅适用于 Mac,但其核心目标非常明确:通过 AI 技术将日常的网络浏览体验提升到新的层次。

Dia 内置了一个类似 ChatGPT 的 AI 聊天工具。用户可以随时呼叫 AI 助手,进行网站内容查询、任务管理和浏览历史回顾,简化信息获取和操作流程。

通过分析用户的浏览习惯和网站访问记录,Dia 提供了高度个性化的功能。

例如,用户可以使用 Dia 进行饮食规划、学习帮助或约会建议等。浏览器的 URL 栏不仅能进行网页搜索,还能调用 AI 助手,增强互动性。

我们之前也体验过 Dia 浏览器,欢迎回看~

实测超火的 AI 浏览器 Dia,我看到了浏览器未来的 iPhone 时刻 

🔗 https://techcrunch.com/2025/06/11/the-browser-company-launches-its-ai-first-browser-dia-in-beta/

Hunt for Tools|先进⼯具

🐧 腾讯开源混元 3D 2.1 大模型

腾讯在 CVPR2025(计算机视觉领域顶会之一)上,宣布混元 3D 2.1 大模型对外开源。

据介绍,这是首个全链路开源的工业级 3D 生成大模型,达到了行业领先水平。

相较于混元 3D 2.0 模型,新模型既优化了几何生成的质量,也开放了PBR(基于物理的渲染)材质生成大模型。新模型可生成基础颜色、金属度、法线、粗糙度等贴图,支持皮革、木质、金属、陶瓷等多种复杂材质的高质量渲染。

相较传统 RGB 贴图技术,PBR技术通过模拟光线与材质的物理交互,提升模型在不同光照环境下的视觉一致性。在用户盲测中,混元 3D 2.1 模型的 PBR 纹理相较于 RGB 贴图,质感胜出率高达 78%。

腾讯方面表示,混元 3D 2.1 降低了开发门槛:全链路开源并且支持消费级显卡部署。另外,在实际应用中,轻游梦工坊使用混元 3D 在多条美术管线完成提效,道具管线制作周期由 2 天/个降低至 0.2 天/个。

目前,腾讯混元 3D 2.1 已上架。

开源网址:https://3d-models.hunyuan.tencent.com/

体验网址:https://3d.hunyuan.tencent.com/

👀 AMD 联合 OpenAI 发布超强 AI 芯片

本周,AMD 举行 2025 全球 AI 发展大会。OpenAI CEO Sam Altman 出席本次大会,并与 AMD 联合发布了 Instinct MI400、Instinct MI350 系列 AI 芯片。

会上,Altman 也直呼「令人惊叹」:「第一次得知芯片规格时,我感觉不可能,这听起来十分疯狂。」

具体来看:

AMD Instinct MI400 系列:

AMD 下一代旗舰 AI 芯片;将作为全新 AI 服务器「Helios」的核心硬件。

预计搭载最高 432GB 的 HBM4 高速显存。

FP4 精度下可达 40 PFLOPS 的算力。

配备 300GB/s 的 scale-out 带宽,通过 UALink 开放标准技术实现 72 个 GPU 无缝互联,使整个「Helios」内的 GPU 能作为统一计算单元协同工作。

MI400 预计将在 2026 年上市。

会上,AMD CEO 苏姿丰表示,MI400 系列的竞争对手将会是英伟达的「Vera Rubin」AI 芯片。

据悉,英伟达于今年 3 月正式公布了下一代 AI 芯片「Vera Rubin」。CEO 黄仁勋表示,Rubin 的性能将达到 Hopper 的 900 倍,而 Blackwell 相较 Hopper 已实现了 68 倍的提升。Vera Rubin 预计将在 2026 年下半年发布。

AMD Instinct MI350 系列: 

基于 AMD CDNA 4 架构打造,拥有 MI350X 和 MI355X 两个版本。

MI355X 在 FP4 性能上达到了 161 PFLOPS,而 MI350X 则在 FP16 性能上达到了 36.8 PFLOPS。

提供灵活的冷却配置:支持风冷和液冷,允许大规模部署。

AMD 表示,得益于 MI350 系列相较于竞争对手功耗更低,MI355X 每美元可以提供比英伟达芯片多 40% 的 token。

🔗 https://www.cnbc.com/2025/06/12/amd-mi400-ai-chips-openai-sam-altman.html

🏆 Meta 发布世界模型,图灵奖得主背书

日前,Meta 开源了最新的重量级模型——V-JEPA 2。

Meta 方面称,V-JEPA 2 的目标是让 AI 能够看懂世界、具备物理推理能力,并在完全陌生的环境中自主完成一系列实际操作任务。

而图灵奖得主、Meta 首席科学家 Yann Lecun 也亲自出镜,为 V-JEPA 2 背书,强调让机器理解物理规则的重要性,认为世界模型能够拥有像人类一样理解世界的常识,不靠海量试错,也能在真实物理世界中行动自如。

据悉,V-JEPA 2 基于 Meta 在 2022 年提出的「联合嵌入预测」架构,旨在通过预测抽象表示而非生成像素或文本,提升模型对物理世界的理解能力。该模型拥有 12 亿参数,并能够能基于画面推测接下来会发生什么。

V-JEPA 2 能提供「理解」「预测」「规划」三个步骤,为 AI 提供「真正行动前能先在脑中推演一遍结果再行动」的模拟。

另外,Meta 还发布了三项新基准测试:IntPhys 2、Minimal Video Pairs、CausalVQA,用于评估模型对视频中物理世界的理解与推理能力。

🔗 https://ai.meta.com/vjepa/

🤯 OpenAI o3-pro 正式发布

本周,OpenAI 正式发布 o3-pro 推理模型,基于 o3 所打造,拥有更强的数学、科学、编程等领域的表现。

性能表现上:

o3-pro 在专家评估中,评审人员普遍认为 o3 Pro 在多方面都比 o3 模型更进一步,尤其适合用在科学、教育、编程、商业和写作这些需要深度输出的任务中。

在学术评估的基准测试中,o3-pro 的整体表现持续优于 o1-pro 和 o3。

OpenAI 还通过四次尝试获取正确答案的方式进行实验发现,o3-pro 能保持较好的性能表现。

据介绍,o3-pro 与 o3 系列一样拥有 200K 的上下文窗口和 100K 的输出。

与 o3 一样,o3-pro 也可调用工具,从而支持搜索、分析文件、视觉推理、使用 Python 等。值得一提的是,o3-pro 支持工具访问,因此响应速度相较于 o1-pro 要更慢。

目前,o3-pro 已向 Pro 和 Team 用户提供,取代 o1-pro;企业版和教育版用户将在下周获得使用权限。

价格方面,o3-pro 输入为 20 美元/百万 token,输出 80 美元/百万 token;而 OpenAI CEO Sam Altman 宣布,o3 降价 80%——因此 o3 价格来到了输出 2 美元/百万 token、输入 8 美元/百万 token。

🔗 https://platform.openai.com/docs/models/o3-pro

👏 Mistral 推出首个推理模型

日前,欧洲 AI 初创公司 Mistral 推出首个推理模型 Magistral。

据官方介绍,Magistral 是一个专注于现实世界推理和反馈驱动的双版本模型,拥有 24B 的 Small 开源版本和更大的 Mdeium 企业版本。

官方表示,Magistral 针对多步逻辑进行微调,并能提供透明化的思考过程;支持多语言推理。

性能表现上,Magistral Medium 在多项基准测试中未超过 DeepSeek-R1,但表现接近;相较于自家 Mistral-Mdeium 3,则有了较大的表现提升。较小的 Small 版本在 AIME2024 测试中得分与 Mdeium 版本接近。

据 Mistral 测试,在 Le Chat 中使用 Flash Answers,Magistral Medium 的 token 吞吐量比大多数竞品快 10 倍。

值得一提的是,Mistral CEO Arthur Mensch 日前在接受 CNBC 采访时表示,Magistral 在数学、编程表现出色。

目前,Magistral Small 已上架 HuggingFace,而 Medium 版本则 Le Chat、La Plateforme 提供预览版 API。

🔗 HuggingFace:https://huggingface.co/mistralai/Magistral-Small-2506

Hunt for Fun|先玩

🏀 NBA 总决赛期间播出的广告由 Veo 3 生成

在刚刚结束的 NBA 总决赛,一则由 AI 生成的广告成功吸引了观众的目光。

自称「AI 电影制片人」的 PJ Accetturo 透露,预测平台 Kalshi 雇佣他利用 Google 的文生视频 Veo 3 制作广告,脚本撰写则借助了 Gemini 聊天机器人,并搭配 ChatGPT 进行创意生成。

他表示,生成这则广告共需 300-400 次生成,才得到 15 个可用片段。

「1 个人,2-3 天。这比传统广告节省了 95% 的成本。」

这段 AI 生成的视频展示了人们在一些奇特事件上的投注,比如俄克拉荷马城雷霆队或印第安纳步行者队会赢 NBA 总决赛、今年会有多少次飓风,或者本月鸡蛋价格会不会涨。画面快速切换,有一个戴牛仔帽抱吉娃娃的老人、一位在鸡蛋池里游泳的人,还有一个外星人正在大喝啤酒。

Kalshi 表示该广告预计将在多个平台上获得超过 2000 万次曝光,公司也已计划继续使用 AI 制作更多内容。「我们一开始并没打算做 AI 视频,但现实条件促使我们做出了选择。事实证明,这一决策非常成功。」

🔗 https://x.com/Kalshi/status/1932891608388681791

Hunt for insights|先知

🧑‍🏫 AI 会取代一半初级白领岗位?英伟达 CEO 反驳

6 月 11 日,在第九届 VivaTech 科技展上,当黄仁勋被问及 Amodei 预测 AI 可能在五年内消灭多达一半的初级白领岗位时,他公开反驳了这一观点,并对限制 AI 发展只由少数几家公司主导的理念表示不认可。

「首先,他(Amodei)认为 AI 太可怕了,只有他们(Anthropic)才能做;第二,他觉得 AI 太昂贵了,其他人都不应该碰;第三,他认为 AI 太强大了,所有人都会因此失业,这也正是他们主张只由自己来开发 AI 的理由。」

他这样评价 Amodei:

「我认为,AI 是非常重要的技术,我们应该以安全和负责任的方式去研发和推进。」黄仁勋继续说道,「如果你真想确保事情安全可靠,就应该让它在公开的环境中进行……不要躲在黑屋子里搞完了再跟我说『这是安全的』。」

不过,黄仁勋也认为,AI 确实会对部分工作产生影响。「每个人的工作都会有所改变。有些职位会被淘汰,但也会创造出许多新岗位……每当企业效率提升,他们往往会雇更多人。

🔗 https://fortune.com/2025/06/11/nvidia-jensen-huang-disagress-anthropic-ceo-dario-amodei-ai-jobs/

💡 OpenAI Codex 团队:未来的 Agent 会趋向独立

日前,OpenAI 编程产品 Codex 的研究员 Hanson Wang 和产品负责人 Alexander Embiricos 在接受了红衫资本的采访,并分享了 Codex 的理念、对未来 AI 编程产品的设想。

采访中,Embiricos 提到,Codex 就像一个思想实验——它拥有自己的电脑,能够独立于用户的工作,用户需要做的就是将任务「委托」给 Codex。

Embiricos 也强调,Codex 就是 OpenAI Agentic 编程的品牌产品,而公司的愿景就是:未来有一个 Agent,它大部分时间在自己的电脑工作,但也能在任何用户需要的工具中起到协助作用。颇有一点「独立编程 Agent」的感觉。

对于 Codex 甚至是 Agent 的未来,Hanson 和 Embiricos 都强调,OpenAI 现在构建的方向,是无论用户从事任何职业,所有容易自动化的工作(通常是那些比较繁琐的工作),用户都不必亲自去做,而是可以委托出去,让 Agent 来进行。

至于那些有趣的、带挑战性的,则是用户自己来主导。同时 Embiricos 也表示,OpenAI 不会一来就用 AI 的方式改变用户习惯,而是让用户在做这件事上变得更简单,让一切做起来更容易。

有趣的是,Embiricos 还在采访中开玩笑式构建了对未来 Agent 使用场景的想象:作为一名创业者,团队只需要几个创始人和许多 Agent,就能像刷抖音、TikTok 一样,在一个 Agent 生成方案、想法的信息流里,挑选出自己想要的内容,来进行下一步。

🔗 采访原文:https://www.sequoiacap.com/podcast/training-data-openai-codex/

💥 揭秘 Claude 多 Agent「研究」功能,还有宝贵的经验分享

Anthropic 首次全面披露旗下 AI 模型 Claude 实现「多 Agnet 协作」研究能力的解读。这项功能已支持在网页、Google Workspace 等平台中完成复杂搜索任务。

Claude 研究团队认为,搜索的本质是一种「压缩」过程,也就是从海量信息中提炼出有价值的观点。

传统 AI 模型大多采用线性流程,一次性生成答案,适用于结构明确、路径清晰的任务。而研究类任务本质上充满不确定性,需要根据阶段性发现灵活调整方向,多轮判断、并行探索成为必要条件。

不过,这种灵活性也伴随着极高的工程代价。

多 Agent 任务的 token 消耗约为日常对话的 15 倍。在 BrowseComp 测试中,三大因素解释了 95% 的性能差异:Token 使用量(占 80%)、工具调用次数、以及模型选择。

因此,多 Agent 协作任务主要适用于信息量庞大、任务价值较高的复杂查询,而非普通问答场景。

多协作 Agent 架构如何运作:

Claude 的研究系统由一个主 Agnet 根据用户请求制定策略,并生成多个子 Agnet 并行查找信息,各自独立运行后将结果汇总,完成深入研究。与传统的检索增强生成(RAG)相比,这样的架构具备动态搜索、多轮分析、结果适应性强等优势。

流程如下:

1.

用户提交查询。

2.

主 Agnet 制定计划并将其保存至记忆模块(用于超过 20 万 token 的长上下文保持)。

3.

主 Agnet 生成多个子 Agnet(数量不固定)并赋予不同的研究任务。

4.

子 Agnet 分别进行搜索、评估结果并将信息返回主 Agnet。

5.

主 Agnet 整合结果,并视情况生成更多子 Agnet 或调整策略。

6.

当信息足够时,交由引用 Agent 标注引用并整理完整报告。

7.

返回包含引用的最终研究结果。

用 Claude 研究团队的话来说:「我们并非为 Agnet 制定死板规则,而是借助提示传授高效的启发式策略。例如:分解任务、评估信息质量、灵活调整搜索路径、判断何时深入 vs 广度探索等。」

附上原文:https://www.anthropic.com/engineering/built-multi-agent-research-system

彩蛋时间

作者:@azed_ai

工具:GPT-4o

Prompt:A high-resolution advertising photograph of a realistic, miniature [想要生成的产品] held delicately between a person's thumb and index finger. clean and white background, studio lighting, soft shadows. The hand is well-groomed, natural skin tone, and positioned to highlight the product’s shape and details. The product appears extremely small but hyper-detailed and brand-accurate, centered in the frame with a shallow depth of field. Emulates luxury product photography and minimalist commercial style.

链接:https://x.com/azed_ai/status/1933901224044294417

图片

欢迎加入 APPSO AI 社群,一起畅聊 AI 产品,获取#AI有用功,解锁更多 AI 新知👇

我们正在招募伙伴

📮 简历投递邮箱hr@ifanr.com

✉️ 邮件标题「姓名+岗位名称」(请随简历附上项目/作品或相关链接)

更多岗位信息请点击这里🔗

阅读原文

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

AI Midjourney Meta OpenAI 模型
相关文章