All in AI,看见未来。 每天精选最值得读的AI文章,帮你筛掉时代的噪音。 以简讯见广度,以深读见洞察。 技术、趋势、思考,一站式掌握AI世界。欢迎关注公众号「AI Reading Hub」,获取更多AI资讯和技术文章。
2025-07-19 资讯日报
新闻资讯
Meta新AI架构,这是对标字节?
Meta经组织调整,整合出3400多人新组织,由亚历山大·王领导。架构类似字节,还不断挖人,引发内部不满。字节AI发展良好,Meta此举或遭反噬。>阅读原文
瑞典AI新星Lovable估值18亿美元成独角兽
瑞典AI公司Lovable成立8个月成独角兽,估值18亿美元,拥有大量用户。它用自然语言编程,获2亿美元A轮融资,付费用户首月留存率超ChatGPT,发展速度惊人。>阅读原文
OpenAI新Agent被中国24人团队碾压
OpenAI推出ChatGPT Agent,可完成多步骤任务。官方称其性能先进,测试数据佳,但实际使用存在局限。海外网友对比发现,中国24人初创团队的Genspark在成本、质量上全面领先。>阅读原文
Gemini 2.5 Pro领跑大模型IMO 2025竞赛
大模型挑战IMO 2025成绩揭晓,Gemini 2.5 Pro大幅领先。测试统一环境、双人匿名评估,涉及多类数学题,几何题模型表现差,人类版结果本周六或发布,最强Gemini也可能无奖牌。>阅读原文
OpenAI神秘模型“o3-alpha”性能超神
OpenAI神秘模型“o3-alpha”测试引发关注,早期表现超神,能一键生成游戏,前端编码能力远超Claude Sonnet等。有人猜测它是AHC模型或即将开源的模型。>阅读原文
孙正义:10亿智能体将取代程序员
孙正义:软银进入‘人类程序员时代终结阶段’,计划用AI智能体接管编程,今年部署10亿个,未来更多,成本低且效率超人类,还假设AGI很快实现。>阅读原文
中国 24 人团队碾压 OpenAI 新 Agent
今日凌晨 OpenAI 推出 ChatGPT Agent,可完成多步骤任务。官方称性能先进,但实际有局限。海外用户对比发现,中国 24 人初创团队的 Genspark 等产品成本低、质量高,领先于 ChatGPT Agent。>阅读原文
ARC - AGI - 3发布,AI全军覆没遭质疑
ARC Prize发布ARC - AGI - 3预览版,人类轻松通关,AI模型全败。测试范式革新,引发社区质疑测试意义,奖金被嘲少,游戏难度和技术问题也遭吐槽,人类通关率也受质疑。>阅读原文
芯片大佬励民身家逼近两百亿
《2025新财富500创富榜》里,瑞芯微励民以173.8亿身家成福州第二富豪,财富涨73%。他多次带公司转型,近年业绩亮眼,但大股东抛减持计划,且公司面临下游需求、竞争等风险。>阅读原文
Supabase CEO:MCP碰生产库风险大
安全研究团队指出,MCP被广泛接入后带来安全挑战,出现“致命三连”攻击模式。如Supabase MCP案例,攻击者通过留言让Cursor代理泄露敏感数据。Supabase CEO提醒勿将MCP连生产库。>阅读原文
OpenAI大佬:AI成人类最强杠杆
OpenAI研究员Hyung Won Chung称AI是强大杠杆,结合人力与科技优势。它提升个人学习效率,智能体让小团队创造大价值,还能加速科学进步,有望突破当前科学发展瓶颈。>阅读原文
2025 IMO:AI数学模型集体翻车
2025 IMO数学竞赛,顶流AI模型全军覆没。Gemini 2.5 Pro得分最高却无缘铜牌,Grok - 4摆烂,DeepSeek - R1退步。AI有思路但逻辑细节差,挑战人类奥数大神为时尚早。>阅读原文
大模型竞赛决胜关键:后训练
大模型竞赛焦点转向后训练,如Grok 4靠强化学习投入获强大推理力。产业应用中通用模型适配难题凸显,后训练方法进化,夸克和阿里云给出实践方案,阿里云提供一体化支撑。>阅读原文
HBM技术崛起,市场竞争白热化
HBM从高性能计算向多领域渗透,技术发展迅速,TSV等技术是关键。各企业技术路线不同,应用广泛但面临挑战。市场竞争激烈,SK海力士领先,三星调整策略,美光追赶扩产。>阅读原文
Meta疯狂挖人,苹果AI人才告急!
Meta在AI人才争夺战中发力,扎克伯格挂帅补短板,重金挖人。苹果2名前AI专家加入Meta,苹果人事动荡,虽加薪留人但难敌Meta高薪,Siri技术方案待抉择。>阅读原文
AI教父:AI永生,人类或成烤面包!
AI教父Hinton称,未来十年AI或在数学超人类,还能改变医疗等领域。但AI能耗增长快,人类将触及能源极限。他担心AI灭绝人类,呼吁政府监管,认为开源模型权重很危险。>阅读原文
产品应用
韩钦亭团队:AI 赋能Profiling性能优化
韩钦亭团队:在 Profiling 平台引入 AI 智能辅助模块。经对比选 DeepSeek R1,以 Service A 为例优化性能。AI 能识别瓶颈、提建议,但业务理解不足。未来将扩展多语言等能力。>阅读原文
AlphaEvolve:AI自我进化新范式
Google发布的AlphaEvolve结合Gemini与evaluator,能发现新算法。它源于FunSearch,在多领域有应用。其运行像自然进化,关键组件evaluator很重要,标志AI进入自我改进范式,但推广面临构建evaluator和计算资源要求高的挑战。>阅读原文
Dan Shipper:AI将改变就业与工作模式
Every 联合创始人 Dan Shipper 认为,AI 不会大规模抢岗,反而促美国就业回流。他盛赞 Claude Code,称其对非程序员价值被低估。他还指出,通才更适应 AI 时代,企业应设 AI 运营负责人。>阅读原文
合合信息:JuiceFS支撑PB级AI训练
合合信息:原存储架构有瓶颈,引入JuiceFS结合BeeGFS构建新架构。通过缓存优化使命中率超90%,还实施数据治理减少冗余,支撑多业务并发,后续将持续完善平台。>阅读原文
解读Qwen3文本嵌入与重排序技术
文本嵌入与重排序是NLP关键。Qwen3 Embedding、Qwen3 Rerank基于Qwen3构建,有三种参数尺寸。介绍模型架构、训练方案,还给出实战代码及相关参考链接。>阅读原文
Decart:MirageLSD或颠覆视频及游戏业
Decart推出实时无限长AI视频模型MirageLSD,响应低于40毫秒。靠历史增强和多技术结合攻克难题。平台将升级,创始人目标打造万亿价值或十亿用户公司,AI视觉革命开启。>阅读原文
MiniMax Agent:AI 全栈开发新利器
作者体验 MiniMax Agent 新功能,两小时搭建出 AI 资讯网站。其全栈开发功能强,有 MCP 生态和多模态能力。虽 OpenAI 推出 ChatGPT Agent,但 MiniMax Agent 或更领先,值得一试。>阅读原文
Decart发布MirageLSD,Karpathy投资站台
Decart发布MirageLSD,是世界首个「实时、无限」扩散视频模型,输入视频流40毫秒内转化画面。前特斯拉AI总监Karpathy投资,他设想多种应用场景。该模型有技术突破,但也存在一些缺陷待改进。>阅读原文
Claude Code 作者:AI 工具应还权用户
Claude Code 创造者 Boris Cherny 称,当下最好的 AI 工具应是简单通用的“乐高积木”,将控制权交予用户。他还回顾编程发展,介绍 Claude Code 工作流和新功能,如计划模式等。>阅读原文
Creati:一年破千万美金的海外AI创意引擎
Creati创始人Ella Zhang:病毒式内容关键在‘爆款创意’,Creati做难而正确的事。它革新网红与商家合作,还将开发创意Agent,助商家降本增效,未来要成一切事物创意引擎。>阅读原文
秘塔AI:让深度研究过程透明化
作者实测秘塔AI的Deep Research,它可视化研究过程,分析Meta挖人、xAI二次元创业机会等问题,速度快、深度广,虽有小瑕疵,但在赛道领先,让研究普惠。>阅读原文
Decart:MirageLSD将变革直播游戏业
Decart推出AI视频模型MirageLSD,响应低于40毫秒,能无限生成视频。靠历史增强和三管齐下策略攻克两大核心难题。创始人目标打造万亿级公司,还将升级功能拓展应用。>阅读原文
Karpathy力挺MirageLSD,颠覆AI视频交互
DecartAI推出实时扩散AI视频模型MirageLSD,大神Karpathy是天使投资人。它能零延迟、无限时长生成视频,每秒24帧不卡顿,解决了误差累积和实时交互难题,应用场景丰富。>阅读原文
推荐文章
优步外卖:优化搜索系统提升体验
优步外卖为优化搜索性能,面临数据索引、检索和排名挑战。通过改进索引布局、采用分片技术、并行化查询等,降低延迟、提高召回率,确保用户快速获相关结果,提升系统可伸缩性。>阅读原文
OpenAI研究员:软件工程本质是人与AI沟通
OpenAI研究员Sean Grove称,程序员重要技能是向AI传达意图,最有价值成果是源规范。规范能让全公司达成一致,还可用于训练模型,未来IDE或成「集成思维澄清器」。>阅读原文
苏仲尧:AI创作让主导权回归人
艺术家苏仲尧在访谈中表示,其个展作品聚焦摄影与AI的技术黑箱。创作分三阶段,最终让创作主导权回归人。他认为技术更迭有规律,让观众在脑海投射想象,探讨技术与人的关系。>阅读原文
季逸超:分享 AI Agent 上下文工程经验
Manus 联合创始人季逸超分享构建 AI Agent 上下文工程经验。如围绕 KV - Cache 设计、用掩码约束行为、将文件系统作上下文等,强调保留错误、增加多样性,助开发者避坑。>阅读原文
AI Infra:传统方法论仍适用于新挑战
QQ基础架构算法工程团队作者分享AI Infra经验。指出硬件从CPU到GPU,软件依赖深度学习框架,模型训练要解决存储和速度问题,推理要降低延时、提高吞吐量,传统方法论仍可用。>阅读原文
4人AI团队两款教育应用成爆款
Oleve联创Sidhant Bendre称小团队时代来临。该4人团队的两款AI教育产品成爆款,靠技术敏锐、“精益增长”策略及全面自动化流程,实现盈利,为小团队创业提供借鉴。>阅读原文
季逸超:分享 Manus 智能体上下文工程心得
季逸超分享 Manus 构建心得,其选择押注上下文工程,介绍提高 KV 缓存命中率等实践,如用掩码管理工具、文件作上下文、复述操控注意力,强调保留错误、避免小样本带偏。>阅读原文
开源动态
中科院自动化所:GThinker模型突破多模态推理瓶颈
中科院自动化所针对多模态大模型通用场景推理瓶颈,提出GThinker。其采用「线索引导式反思」模式,经自由推理、反思触发、线索反思三阶段,两阶段训练后,性能超O4 - mini,提升通用能力。>阅读原文
王华杰:从开源项目到创业推 Awestream
王华杰:三年前将 StreamPark 捐给 Apache 成大数据领域首个个人捐赠开源项目。现创业成立公司,推出 Awestream 平台,融合 AI 等能力,解决企业实时计算难题。>阅读原文
ColQwen - Omni:跨模态RAG模型革新检索体验
Vidore开源的ColQwen - Omni多模态RAG模型,解决传统RAG痛点。支持跨模态检索,直接处理音视频原始数据,检索快且轻量高效,适用于音视频检索、文档问答等多场景。>阅读原文
网页智能体训练数据生成实现自动化
卡内基梅隆大学与亚马逊团队实现网页智能体训练数据生成自动化。构建的数据集让微调后的 Qwen3 - 1.7B 超越大模型,还公开数据和方法,有望提升网页智能体能力。>阅读原文
FlashInfer集成TensorRT-LLM技术分析
文章聚焦FlashInfer集成TensorRT-LLM技术,以MoE模块为例,分析集成架构设计、源码集成方法、CUBIN动态加载系统等,该集成避免依赖源码,能动态管理CUBIN文件,让源码在JIT编译前不大。>阅读原文
微软:「0污染」LLM理解基准来了!
微软亚洲研究院推出MMLU-CF基准测试,含20000题覆盖14学科。用去污染规则和闭源测试集防数据泄露,评估更可靠,扰乱了部分模型在MMLU上的排名。>阅读原文
腾讯:7B模型‘情商’比肩GPT - 4o
腾讯混元AI数字人团队提出RLVER框架,为开放域RL难题提供解法。经训练的Qwen2.5 - 7B模型表现提升显著,比肩顶级商用模型,团队还在训练中获得关于模型路径、算法及训练环境的洞察。>阅读原文
Kimi K2超越DeepSeek成全球开源第一
Kimi K2超越DeepSeek成全球开源第一,紧追顶尖闭源模型。虽被质疑用DeepSeek V3架构,但团队称有参数调整。如今开源模型崛起,打破性能弱刻板印象,行业人士看好其发展。>阅读原文
斯坦福开源复杂推理AI Agent OctoTools
斯坦福:为解决传统AI助手难题,开源OctoTools,它融合11种工具,在16项测试中准确率高,框架含工具卡片、规划器等,能应对数学、医学等复杂场景。>阅读原文
算法论文
工行&上交大:TACTIC刷新翻译新高度
2025年多智能体系统成大模型研发热点。工行与上海交大联合推出多智能体翻译系统TACTIC,以认知翻译学为指导,提升翻译效果,在小模型下更显著,还验证了多轮翻译机制有效性。>阅读原文
ColPali:让文档检索“降本增效”
传统文档检索依赖文本提取,处理含图表文档时性能受限。ColPali直接从文档图像生成多向量嵌入,简化流程、提升性能。ColQwen - Omni借鉴其架构,扩展到图文+音频多模态匹配。>阅读原文
西北工大团队:融合激波位置辨识气动载荷
西北工业大学马启悦、高传强等提出融合激波位置的跨声速抖振气动载荷辨识方法,分析激波运动特征,构建升力系数代数方程,提升预测精度,评估了噪声影响,为相关建模提供潜在方案。>阅读原文
上下文工程:为大模型研究指明新方向
论文提出“上下文工程”学科,构建双层框架整合技术。指出LLMs理解强于生成,存在评估困境和技术瓶颈。未来研究应聚焦理论、技术和伦理方向。>阅读原文
PresentAgent:文档秒变带解说演示视频
AI Geeks等联合团队:提出 PresentAgent 实现文档到演示视频生成,采用模块化流程。还推出 PresentEval 评估框架,实验表明其接近人类表现,潜力巨大。>阅读原文
</p>