AI Daily | AI日报：Meta新AI架构，这是对标字节？; 瑞典AI新星Lovable估值18亿美元成独角兽; OpenAI新Agent被中国24人团队碾压

All in AI，看见未来。每天精选最值得读的AI文章，帮你筛掉时代的噪音。以简讯见广度，以深读见洞察。技术、趋势、思考，一站式掌握AI世界。欢迎关注公众号「AI Reading Hub」，获取更多AI资讯和技术文章。

2025-07-19 资讯日报

新闻资讯

Meta新AI架构，这是对标字节？

Meta经组织调整，整合出3400多人新组织，由亚历山大·王领导。架构类似字节，还不断挖人，引发内部不满。字节AI发展良好，Meta此举或遭反噬。>阅读原文

瑞典AI新星Lovable估值18亿美元成独角兽

瑞典AI公司Lovable成立8个月成独角兽，估值18亿美元，拥有大量用户。它用自然语言编程，获2亿美元A轮融资，付费用户首月留存率超ChatGPT，发展速度惊人。>阅读原文

OpenAI新Agent被中国24人团队碾压

OpenAI推出ChatGPT Agent，可完成多步骤任务。官方称其性能先进，测试数据佳，但实际使用存在局限。海外网友对比发现，中国24人初创团队的Genspark在成本、质量上全面领先。>阅读原文

Gemini 2.5 Pro领跑大模型IMO 2025竞赛

大模型挑战IMO 2025成绩揭晓，Gemini 2.5 Pro大幅领先。测试统一环境、双人匿名评估，涉及多类数学题，几何题模型表现差，人类版结果本周六或发布，最强Gemini也可能无奖牌。>阅读原文

OpenAI神秘模型“o3-alpha”性能超神

OpenAI神秘模型“o3-alpha”测试引发关注，早期表现超神，能一键生成游戏，前端编码能力远超Claude Sonnet等。有人猜测它是AHC模型或即将开源的模型。>阅读原文

孙正义：10亿智能体将取代程序员

孙正义：软银进入‘人类程序员时代终结阶段’，计划用AI智能体接管编程，今年部署10亿个，未来更多，成本低且效率超人类，还假设AGI很快实现。>阅读原文

中国 24 人团队碾压 OpenAI 新 Agent

今日凌晨 OpenAI 推出 ChatGPT Agent，可完成多步骤任务。官方称性能先进，但实际有局限。海外用户对比发现，中国 24 人初创团队的 Genspark 等产品成本低、质量高，领先于 ChatGPT Agent。>阅读原文

ARC - AGI - 3发布，AI全军覆没遭质疑

ARC Prize发布ARC - AGI - 3预览版，人类轻松通关，AI模型全败。测试范式革新，引发社区质疑测试意义，奖金被嘲少，游戏难度和技术问题也遭吐槽，人类通关率也受质疑。>阅读原文

芯片大佬励民身家逼近两百亿

《2025新财富500创富榜》里，瑞芯微励民以173.8亿身家成福州第二富豪，财富涨73%。他多次带公司转型，近年业绩亮眼，但大股东抛减持计划，且公司面临下游需求、竞争等风险。>阅读原文

Supabase CEO：MCP碰生产库风险大

安全研究团队指出，MCP被广泛接入后带来安全挑战，出现“致命三连”攻击模式。如Supabase MCP案例，攻击者通过留言让Cursor代理泄露敏感数据。Supabase CEO提醒勿将MCP连生产库。>阅读原文

OpenAI大佬：AI成人类最强杠杆

OpenAI研究员Hyung Won Chung称AI是强大杠杆，结合人力与科技优势。它提升个人学习效率，智能体让小团队创造大价值，还能加速科学进步，有望突破当前科学发展瓶颈。>阅读原文

2025 IMO：AI数学模型集体翻车

2025 IMO数学竞赛，顶流AI模型全军覆没。Gemini 2.5 Pro得分最高却无缘铜牌，Grok - 4摆烂，DeepSeek - R1退步。AI有思路但逻辑细节差，挑战人类奥数大神为时尚早。>阅读原文

大模型竞赛决胜关键：后训练

大模型竞赛焦点转向后训练，如Grok 4靠强化学习投入获强大推理力。产业应用中通用模型适配难题凸显，后训练方法进化，夸克和阿里云给出实践方案，阿里云提供一体化支撑。>阅读原文

HBM技术崛起，市场竞争白热化

HBM从高性能计算向多领域渗透，技术发展迅速，TSV等技术是关键。各企业技术路线不同，应用广泛但面临挑战。市场竞争激烈，SK海力士领先，三星调整策略，美光追赶扩产。>阅读原文

Meta疯狂挖人，苹果AI人才告急！

Meta在AI人才争夺战中发力，扎克伯格挂帅补短板，重金挖人。苹果2名前AI专家加入Meta，苹果人事动荡，虽加薪留人但难敌Meta高薪，Siri技术方案待抉择。>阅读原文

AI教父：AI永生，人类或成烤面包！

AI教父Hinton称，未来十年AI或在数学超人类，还能改变医疗等领域。但AI能耗增长快，人类将触及能源极限。他担心AI灭绝人类，呼吁政府监管，认为开源模型权重很危险。>阅读原文

产品应用

韩钦亭团队：AI 赋能Profiling性能优化

韩钦亭团队：在 Profiling 平台引入 AI 智能辅助模块。经对比选 DeepSeek R1，以 Service A 为例优化性能。AI 能识别瓶颈、提建议，但业务理解不足。未来将扩展多语言等能力。>阅读原文

AlphaEvolve：AI自我进化新范式

Google发布的AlphaEvolve结合Gemini与evaluator，能发现新算法。它源于FunSearch，在多领域有应用。其运行像自然进化，关键组件evaluator很重要，标志AI进入自我改进范式，但推广面临构建evaluator和计算资源要求高的挑战。>阅读原文

Dan Shipper：AI将改变就业与工作模式

Every 联合创始人 Dan Shipper 认为，AI 不会大规模抢岗，反而促美国就业回流。他盛赞 Claude Code，称其对非程序员价值被低估。他还指出，通才更适应 AI 时代，企业应设 AI 运营负责人。>阅读原文

合合信息：JuiceFS支撑PB级AI训练

合合信息：原存储架构有瓶颈，引入JuiceFS结合BeeGFS构建新架构。通过缓存优化使命中率超90%，还实施数据治理减少冗余，支撑多业务并发，后续将持续完善平台。>阅读原文

解读Qwen3文本嵌入与重排序技术

文本嵌入与重排序是NLP关键。Qwen3 Embedding、Qwen3 Rerank基于Qwen3构建，有三种参数尺寸。介绍模型架构、训练方案，还给出实战代码及相关参考链接。>阅读原文

Decart：MirageLSD或颠覆视频及游戏业

Decart推出实时无限长AI视频模型MirageLSD，响应低于40毫秒。靠历史增强和多技术结合攻克难题。平台将升级，创始人目标打造万亿价值或十亿用户公司，AI视觉革命开启。>阅读原文

MiniMax Agent：AI 全栈开发新利器

作者体验 MiniMax Agent 新功能，两小时搭建出 AI 资讯网站。其全栈开发功能强，有 MCP 生态和多模态能力。虽 OpenAI 推出 ChatGPT Agent，但 MiniMax Agent 或更领先，值得一试。>阅读原文

Decart发布MirageLSD，Karpathy投资站台

Decart发布MirageLSD，是世界首个「实时、无限」扩散视频模型，输入视频流40毫秒内转化画面。前特斯拉AI总监Karpathy投资，他设想多种应用场景。该模型有技术突破，但也存在一些缺陷待改进。>阅读原文

Claude Code 作者：AI 工具应还权用户

Claude Code 创造者 Boris Cherny 称，当下最好的 AI 工具应是简单通用的“乐高积木”，将控制权交予用户。他还回顾编程发展，介绍 Claude Code 工作流和新功能，如计划模式等。>阅读原文

Creati：一年破千万美金的海外AI创意引擎

Creati创始人Ella Zhang：病毒式内容关键在‘爆款创意’，Creati做难而正确的事。它革新网红与商家合作，还将开发创意Agent，助商家降本增效，未来要成一切事物创意引擎。>阅读原文

秘塔AI：让深度研究过程透明化

作者实测秘塔AI的Deep Research，它可视化研究过程，分析Meta挖人、xAI二次元创业机会等问题，速度快、深度广，虽有小瑕疵，但在赛道领先，让研究普惠。>阅读原文

Decart：MirageLSD将变革直播游戏业

Decart推出AI视频模型MirageLSD，响应低于40毫秒，能无限生成视频。靠历史增强和三管齐下策略攻克两大核心难题。创始人目标打造万亿级公司，还将升级功能拓展应用。>阅读原文

Karpathy力挺MirageLSD，颠覆AI视频交互

DecartAI推出实时扩散AI视频模型MirageLSD，大神Karpathy是天使投资人。它能零延迟、无限时长生成视频，每秒24帧不卡顿，解决了误差累积和实时交互难题，应用场景丰富。>阅读原文

开源动态

中科院自动化所：GThinker模型突破多模态推理瓶颈

中科院自动化所针对多模态大模型通用场景推理瓶颈，提出GThinker。其采用「线索引导式反思」模式，经自由推理、反思触发、线索反思三阶段，两阶段训练后，性能超O4 - mini，提升通用能力。>阅读原文

王华杰：从开源项目到创业推 Awestream

王华杰：三年前将 StreamPark 捐给 Apache 成大数据领域首个个人捐赠开源项目。现创业成立公司，推出 Awestream 平台，融合 AI 等能力，解决企业实时计算难题。>阅读原文

ColQwen - Omni：跨模态RAG模型革新检索体验

Vidore开源的ColQwen - Omni多模态RAG模型，解决传统RAG痛点。支持跨模态检索，直接处理音视频原始数据，检索快且轻量高效，适用于音视频检索、文档问答等多场景。>阅读原文

网页智能体训练数据生成实现自动化

卡内基梅隆大学与亚马逊团队实现网页智能体训练数据生成自动化。构建的数据集让微调后的 Qwen3 - 1.7B 超越大模型，还公开数据和方法，有望提升网页智能体能力。>阅读原文

FlashInfer集成TensorRT-LLM技术分析

文章聚焦FlashInfer集成TensorRT-LLM技术，以MoE模块为例，分析集成架构设计、源码集成方法、CUBIN动态加载系统等，该集成避免依赖源码，能动态管理CUBIN文件，让源码在JIT编译前不大。>阅读原文

微软：「0污染」LLM理解基准来了！

微软亚洲研究院推出MMLU-CF基准测试，含20000题覆盖14学科。用去污染规则和闭源测试集防数据泄露，评估更可靠，扰乱了部分模型在MMLU上的排名。>阅读原文

腾讯：7B模型‘情商’比肩GPT - 4o

腾讯混元AI数字人团队提出RLVER框架，为开放域RL难题提供解法。经训练的Qwen2.5 - 7B模型表现提升显著，比肩顶级商用模型，团队还在训练中获得关于模型路径、算法及训练环境的洞察。>阅读原文

Kimi K2超越DeepSeek成全球开源第一

Kimi K2超越DeepSeek成全球开源第一，紧追顶尖闭源模型。虽被质疑用DeepSeek V3架构，但团队称有参数调整。如今开源模型崛起，打破性能弱刻板印象，行业人士看好其发展。>阅读原文

斯坦福开源复杂推理AI Agent OctoTools

斯坦福：为解决传统AI助手难题，开源OctoTools，它融合11种工具，在16项测试中准确率高，框架含工具卡片、规划器等，能应对数学、医学等复杂场景。>阅读原文

算法论文

工行&上交大：TACTIC刷新翻译新高度

2025年多智能体系统成大模型研发热点。工行与上海交大联合推出多智能体翻译系统TACTIC，以认知翻译学为指导，提升翻译效果，在小模型下更显著，还验证了多轮翻译机制有效性。>阅读原文

ColPali：让文档检索“降本增效”

传统文档检索依赖文本提取，处理含图表文档时性能受限。ColPali直接从文档图像生成多向量嵌入，简化流程、提升性能。ColQwen - Omni借鉴其架构，扩展到图文+音频多模态匹配。>阅读原文

西北工大团队：融合激波位置辨识气动载荷

西北工业大学马启悦、高传强等提出融合激波位置的跨声速抖振气动载荷辨识方法，分析激波运动特征，构建升力系数代数方程，提升预测精度，评估了噪声影响，为相关建模提供潜在方案。>阅读原文

上下文工程：为大模型研究指明新方向

论文提出“上下文工程”学科，构建双层框架整合技术。指出LLMs理解强于生成，存在评估困境和技术瓶颈。未来研究应聚焦理论、技术和伦理方向。>阅读原文

PresentAgent：文档秒变带解说演示视频

AI Geeks等联合团队：提出 PresentAgent 实现文档到演示视频生成，采用模块化流程。还推出 PresentEval 评估框架，实验表明其接近人类表现，潜力巨大。>阅读原文

    </p>

官网：www.AiReadingHub.com