All in AI,看见未来。 每天精选最值得读的AI文章,帮你筛掉时代的噪音。 以简讯见广度,以深读见洞察。 技术、趋势、思考,一站式掌握AI世界。欢迎关注公众号「AI Reading Hub」,获取更多AI资讯和技术文章。
2025-06-30 资讯日报
新闻资讯
英伟达收购清华系Nexusflow
英伟达收购清华系AI公司Nexusflow,黄仁勋招募联合创始人。该公司开源模型表现出色,超GPT - 4等。英伟达2024年收购活跃,收购后整合技术,此次或也将团队技术融入体系。>阅读原文
OpenAI五级AGI论文,微软130亿投资或泡汤
Ilya Sutskever预言AI强大且影响深远,担忧其失控。OpenAI与微软合同中AGI条款成谈判焦点,未公开论文划分AGI五级,OpenAI发展加速让微软130亿投资面临风险。>阅读原文
Meta挖角,OpenAI高管发飙应对
Meta用1亿美元签约奖金从OpenAI挖角,OpenAI首席研究官Mark Chen发飙。OpenAI积极应对,如重新调整薪酬,还反思方向,要专注实现通用人工智能,将Meta挖角视为支线任务。>阅读原文
Nature:博士过剩,高校装不下了
过去几十年全球博士毕业生大增,远超学术界岗位。如今就业转向工业界,学者呼吁重新评估博士用途,部分国家已做改变,但大学对学生非学术就业准备支持不足。>阅读原文
马斯克生日:Model Y无人「自驾交付」创历史
特斯拉AI团队提前给马斯克生日惊喜,一辆Model Y无人自驾30分钟从工厂到车主家,完成人类首次端到端交付,场景复杂度超对手,马斯克激动祝贺。>阅读原文
Meta高薪挖人,OpenAI全员放假一周!
生成式AI竞争时,OpenAI全员放假一周,因被Meta高薪连挖8人。OpenAI高管承诺应对,Mark Chen鼓励员工留下,公司将专注通用人工智能,也有人质疑Meta挖人效果。>阅读原文
1500名作家向AI生成内容宣战
1500位作家联名向美国出版商发公开信,要求拒绝AI创作内容,称其训练用了自己心血之作。此前法院裁定用版权书训练AI合理,这场创作本质的战争才刚开始。>阅读原文
Sam Altman:人类迈向数字超级智能时代
OpenAI的Sam Altman认为人类迈向数字超级智能时代。预测2025 - 2027年有智能体、新见解系统、执行任务机器人出现。2030年代智力和能源丰富,虽有挑战,但进步显著。>阅读原文
小扎挖人,OpenAI:奉陪到底!
小扎挖走OpenAI四名顶尖华人研发领导,给钱激进。OpenAI首席研究官Mark Chen发全员信,称将奉陪到底,重新调整薪酬。小扎挑OpenAI员工休整时挖人,打心理战。>阅读原文
方汉:AI淘汰“中间层”,从业者需“上下兼容”
昆仑万维方汉称,AI是“催化剂”,能全面提升行业效率。从业者要么冲进前10%,要么学会“向下兼容”。企业出海要选好市场、做好本地化。AI价格会下降,视频领域短剧是突破口。>阅读原文
Meta挖人,OpenAI加薪放假留人
Meta疯狂挖人,约十位OpenAI员工跳槽。OpenAI首席研究官称像被偷东西,高层发备忘录,决定重新调整薪酬、全员放假。AI人才抢夺战白热化,行业形成“鄙视链”。>阅读原文
产品应用
OpenArt:10 人团队 1600 万美金 ARR 的秘诀
华人团队 OpenArt 10 人获 1600 万美金 ARR。其找准三类核心用户定位,借程序化 SEO 增长,战略转向视觉故事讲述,以多模态集成解决角色一致性,还运用多工具打造技术栈。>阅读原文
Claude变身人生教练,记忆功能超强大
作者成峰将Claude打造成带记忆人生教练,记忆功能使其能回顾旧对话。技术栈简单,相比传统教练费用低、随时可用。虽有局限,但能发现认知盲区,未来会手搓人物、轻量化部署。>阅读原文
FairyGen:让孩子画作变身卡通短片
FairyGen 可把孩子画作变成卡通短片,通过多模态大语言模型构思分镜,用分层建模处理前景与背景。其生成流程分四阶段,但存在前景重建不准、背景生成不稳定等问题。>阅读原文
实测EVE:AI娱乐赛道的惊喜之作
作者实测EVE后赞其为AI娱乐赛道希望。它有好感度、记忆等系统,聊天有活人感、主动性,还能用Agent点奶茶,内测虽有功能未开放,但未来可期,让人期待男性向版本。>阅读原文
推荐文章
Lei Mao:CUDA归约操作实现与性能分析
Lei Mao介绍CUDA归约操作,实现两个批量归约求和kernel,其性能相似,有效带宽约为GPU峰值带宽94%。对于大数组归约,可拆分计算或用原子操作,后者性能或有变化。>阅读原文
开源动态
谷歌发布免费AI Agent,程序员有福啦
谷歌发布免费开源的AI Agent Gemini CLI,免费额度高,可直接在终端运行。它能力不限于编码,功能强大易上手,虽刚发布有不稳定情况,但有望积累用户和社区生态,给同类产品施压。>阅读原文
FLUX.1 Kontext[dev]开源,小参数对标GPT-4o
Black Forest Labs开源图像模型FLUX.1 Kontext[dev],12B参数性能强,能在消费级硬件运行。它有多种编辑特点,经优化训练,在基准测试中表现优于不少模型,推理快但在部分设备迭代慢。>阅读原文
腾讯开源混元Hunyuan - A13B,性能超DeepSeek
腾讯开源新版混元模型Hunyuan - A13B,支持快慢思考模式,强化AI Agent。测试中多方面超DeepSeek - R1等,架构、训练和推理有优化,多阶段训练提升各维度性能。>阅读原文
算法论文
华为CloudMatrix384:颠覆AI数据中心范式
华为发布论文提出CloudMatrix384,其具全对等互联、云原生等特性,性能超NVIDIA H100。打破算力、延迟和成本“不可能三角”,重新定义AI基础设施,已在华为云多节点上线。>阅读原文
盘点2017年后LLM领域重要论文
机器之心盘点2017年Transformer后LLM领域重要论文。像‘Attention Is All You Need’提出Transformer架构;‘Language Models are Few - Shot Learners’介绍GPT - 3能力,推动LLM发展,各论文影响深远。>阅读原文
BioCLIP 2:2亿图像炼就生物识别大模型
俄亥俄州立大学团队:用2亿生物图像训练BioCLIP 2模型,物种识别性能优,在非物种任务中表现出色,还涌现出生物学理解,证明扩大训练规模有增益。>阅读原文
思维锚点:破解LLM推理黑箱关键
编辑部:提出思维锚点概念,开发三种归因方法,发现计划/回溯句主导推理方向,句子级分析是解构推理有效抽象层,未来可用于动态干预、训练优化等。>阅读原文
HoPE:提升VLM长视频理解能力
CMU和小红书团队:现有的视觉语言模型在长上下文任务表现差,保留RoPE所有频率影响长上下文语义建模,提出的HoPE混合位置编码,提升VLM长度泛化能力,实验表现卓越。>阅读原文
Meta:在线DPO/GRPO微调大模型优于离线DPO
Meta和NYU研究表明:半在线和在线训练方法在大模型微调中显著优于离线方法,多任务结合可验证与不可验证任务能进一步提升性能,还给出了不同任务的测试数据作支撑。>阅读原文
微软:DVD智能体登顶长视频理解基准
微软推出Deep Video Discovery (DVD)智能体用于长视频理解。它将长视频分割处理,利用LLM推理,配备工具集。在LVBench等多个长视频基准测试中表现卓越,消融研究为后续设计提供参考。>阅读原文
DeepResearch:技术飞跃与发展挑战
华为等研究者论文指出,DeepResearch是RAG迈向Agent标志性应用,由大语言模型驱动。它核心技术组件协同作用,但面临信息获取等挑战,未来需拓宽边界、增强可信度等。>阅读原文
伯克利InFOM:强化学习预训练效果提升20倍
伯克利团队提出InFOM新方法,不依赖奖励信号。在多任务测试中,它比八个基线方法表现优,如在jaco任务提升20倍,还能更高效推断用户意图。>阅读原文
</p>