AI Daily | AI日报：英伟达收购清华系Nexusflow; OpenAI五级AGI论文，微软130亿投资或泡汤; Meta挖角，OpenAI高管发飙应对

All in AI，看见未来。每天精选最值得读的AI文章，帮你筛掉时代的噪音。以简讯见广度，以深读见洞察。技术、趋势、思考，一站式掌握AI世界。欢迎关注公众号「AI Reading Hub」，获取更多AI资讯和技术文章。

2025-06-30 资讯日报

新闻资讯

英伟达收购清华系Nexusflow

英伟达收购清华系AI公司Nexusflow，黄仁勋招募联合创始人。该公司开源模型表现出色，超GPT - 4等。英伟达2024年收购活跃，收购后整合技术，此次或也将团队技术融入体系。>阅读原文

OpenAI五级AGI论文，微软130亿投资或泡汤

Ilya Sutskever预言AI强大且影响深远，担忧其失控。OpenAI与微软合同中AGI条款成谈判焦点，未公开论文划分AGI五级，OpenAI发展加速让微软130亿投资面临风险。>阅读原文

Meta挖角，OpenAI高管发飙应对

Meta用1亿美元签约奖金从OpenAI挖角，OpenAI首席研究官Mark Chen发飙。OpenAI积极应对，如重新调整薪酬，还反思方向，要专注实现通用人工智能，将Meta挖角视为支线任务。>阅读原文

Nature：博士过剩，高校装不下了

过去几十年全球博士毕业生大增，远超学术界岗位。如今就业转向工业界，学者呼吁重新评估博士用途，部分国家已做改变，但大学对学生非学术就业准备支持不足。>阅读原文

马斯克生日：Model Y无人「自驾交付」创历史

特斯拉AI团队提前给马斯克生日惊喜，一辆Model Y无人自驾30分钟从工厂到车主家，完成人类首次端到端交付，场景复杂度超对手，马斯克激动祝贺。>阅读原文

Meta高薪挖人，OpenAI全员放假一周！

生成式AI竞争时，OpenAI全员放假一周，因被Meta高薪连挖8人。OpenAI高管承诺应对，Mark Chen鼓励员工留下，公司将专注通用人工智能，也有人质疑Meta挖人效果。>阅读原文

1500名作家向AI生成内容宣战

1500位作家联名向美国出版商发公开信，要求拒绝AI创作内容，称其训练用了自己心血之作。此前法院裁定用版权书训练AI合理，这场创作本质的战争才刚开始。>阅读原文

Sam Altman：人类迈向数字超级智能时代

OpenAI的Sam Altman认为人类迈向数字超级智能时代。预测2025 - 2027年有智能体、新见解系统、执行任务机器人出现。2030年代智力和能源丰富，虽有挑战，但进步显著。>阅读原文

小扎挖人，OpenAI：奉陪到底！

小扎挖走OpenAI四名顶尖华人研发领导，给钱激进。OpenAI首席研究官Mark Chen发全员信，称将奉陪到底，重新调整薪酬。小扎挑OpenAI员工休整时挖人，打心理战。>阅读原文

方汉：AI淘汰“中间层”，从业者需“上下兼容”

昆仑万维方汉称，AI是“催化剂”，能全面提升行业效率。从业者要么冲进前10%，要么学会“向下兼容”。企业出海要选好市场、做好本地化。AI价格会下降，视频领域短剧是突破口。>阅读原文

Meta挖人，OpenAI加薪放假留人

Meta疯狂挖人，约十位OpenAI员工跳槽。OpenAI首席研究官称像被偷东西，高层发备忘录，决定重新调整薪酬、全员放假。AI人才抢夺战白热化，行业形成“鄙视链”。>阅读原文

产品应用

OpenArt：10 人团队 1600 万美金 ARR 的秘诀

华人团队 OpenArt 10 人获 1600 万美金 ARR。其找准三类核心用户定位，借程序化 SEO 增长，战略转向视觉故事讲述，以多模态集成解决角色一致性，还运用多工具打造技术栈。>阅读原文

Claude变身人生教练，记忆功能超强大

作者成峰将Claude打造成带记忆人生教练，记忆功能使其能回顾旧对话。技术栈简单，相比传统教练费用低、随时可用。虽有局限，但能发现认知盲区，未来会手搓人物、轻量化部署。>阅读原文

FairyGen：让孩子画作变身卡通短片

FairyGen 可把孩子画作变成卡通短片，通过多模态大语言模型构思分镜，用分层建模处理前景与背景。其生成流程分四阶段，但存在前景重建不准、背景生成不稳定等问题。>阅读原文

实测EVE：AI娱乐赛道的惊喜之作

作者实测EVE后赞其为AI娱乐赛道希望。它有好感度、记忆等系统，聊天有活人感、主动性，还能用Agent点奶茶，内测虽有功能未开放，但未来可期，让人期待男性向版本。>阅读原文

开源动态

谷歌发布免费AI Agent，程序员有福啦

谷歌发布免费开源的AI Agent Gemini CLI，免费额度高，可直接在终端运行。它能力不限于编码，功能强大易上手，虽刚发布有不稳定情况，但有望积累用户和社区生态，给同类产品施压。>阅读原文

FLUX.1 Kontext[dev]开源，小参数对标GPT-4o

Black Forest Labs开源图像模型FLUX.1 Kontext[dev]，12B参数性能强，能在消费级硬件运行。它有多种编辑特点，经优化训练，在基准测试中表现优于不少模型，推理快但在部分设备迭代慢。>阅读原文

腾讯开源混元Hunyuan - A13B，性能超DeepSeek

腾讯开源新版混元模型Hunyuan - A13B，支持快慢思考模式，强化AI Agent。测试中多方面超DeepSeek - R1等，架构、训练和推理有优化，多阶段训练提升各维度性能。>阅读原文

算法论文

华为CloudMatrix384：颠覆AI数据中心范式

华为发布论文提出CloudMatrix384，其具全对等互联、云原生等特性，性能超NVIDIA H100。打破算力、延迟和成本“不可能三角”，重新定义AI基础设施，已在华为云多节点上线。>阅读原文

盘点2017年后LLM领域重要论文

机器之心盘点2017年Transformer后LLM领域重要论文。像‘Attention Is All You Need’提出Transformer架构；‘Language Models are Few - Shot Learners’介绍GPT - 3能力，推动LLM发展，各论文影响深远。>阅读原文

BioCLIP 2：2亿图像炼就生物识别大模型

俄亥俄州立大学团队：用2亿生物图像训练BioCLIP 2模型，物种识别性能优，在非物种任务中表现出色，还涌现出生物学理解，证明扩大训练规模有增益。>阅读原文

思维锚点：破解LLM推理黑箱关键

编辑部：提出思维锚点概念，开发三种归因方法，发现计划/回溯句主导推理方向，句子级分析是解构推理有效抽象层，未来可用于动态干预、训练优化等。>阅读原文

HoPE：提升VLM长视频理解能力

CMU和小红书团队：现有的视觉语言模型在长上下文任务表现差，保留RoPE所有频率影响长上下文语义建模，提出的HoPE混合位置编码，提升VLM长度泛化能力，实验表现卓越。>阅读原文

Meta：在线DPO/GRPO微调大模型优于离线DPO

Meta和NYU研究表明：半在线和在线训练方法在大模型微调中显著优于离线方法，多任务结合可验证与不可验证任务能进一步提升性能，还给出了不同任务的测试数据作支撑。>阅读原文

微软：DVD智能体登顶长视频理解基准

微软推出Deep Video Discovery (DVD)智能体用于长视频理解。它将长视频分割处理，利用LLM推理，配备工具集。在LVBench等多个长视频基准测试中表现卓越，消融研究为后续设计提供参考。>阅读原文

DeepResearch：技术飞跃与发展挑战

华为等研究者论文指出，DeepResearch是RAG迈向Agent标志性应用，由大语言模型驱动。它核心技术组件协同作用，但面临信息获取等挑战，未来需拓宽边界、增强可信度等。>阅读原文

伯克利InFOM：强化学习预训练效果提升20倍

伯克利团队提出InFOM新方法，不依赖奖励信号。在多任务测试中，它比八个基线方法表现优，如在jaco任务提升20倍，还能更高效推断用户意图。>阅读原文

    </p>

官网：www.AiReadingHub.com