All in AI,看见未来。 每天精选最值得读的AI文章,帮你筛掉时代的噪音。 以简讯见广度,以深读见洞察。 技术、趋势、思考,一站式掌握AI世界。欢迎关注公众号「AI Reading Hub」,获取更多AI资讯和技术文章。
2025-06-25 资讯日报
新闻资讯
Replit ARR破亿,Agent助力6月增10倍
Replit 宣布 ARR 突破 1 亿美金,从 1000 万到 1 亿仅 6 个月。它始于 2016 年,早期营收差,2024 年 9 月推 Agent 产品,转变编程模式,实现 ARR 10 倍增长。>阅读原文
韩国核灾难机器人:丑却实用潜力大
韩国原子能研究院开发核灾难处理人形机器人,目标举200公斤重物,远超多数同类。虽有人担忧辐射影响,但现代防护技术有进步。实用性强,长期测试后或带来核废料处理革命。>阅读原文
Wix 8000万美元收购AI平台Base44
著名SaaS平台Wix以8000万美元收购AI开发平台Base44。Base44核心产品简单易用,虽用户仅几千人,但商业表现亮眼。收购后Wix业务拓展,向对话式AI平台转型。>阅读原文
Delphi获融资,让数字心智传承智慧
Delphi获红杉1600万美元融资,创始人受中风祖父回忆录启发创业。其核心是捕捉思维方式,非简单克隆。能应用于多场景创收,重新定义传承,让智慧活在对话里。>阅读原文
OpenAI:弃iyO收购io,进军AI硬件
OpenAI Sam Altman公布邮件,显示收购io为开发硬件语音AI Agent。iyO邀投资合作,演示失败被弃。双方因名字打官司,或庭外和解,iyO获赔偿。>阅读原文
Der8auer 改装 RTX 5090 击败 RTX Pro 6000
硬件改装大师 Der8auer 用 Shunt mod 改装华硕 ROG Astral LC RTX 5090,解锁功率限制提升性能,超越 RTX Pro 6000,但改装有风险,更适用于液冷显卡。>阅读原文
谷歌推可本地运行的具身Gemini模型
谷歌DeepMind推出Gemini Robotics On-Device,可本地运行于机器人,适应新任务。还将发SDK助开发者。同时下调Gemini免费额度,推出图像生成模型Imagen 4和Imagen 4 Ultra,离具身智能时代更近。>阅读原文
苹果:更新模型加强生成式 AI 布局
苹果更新 AFM 系列模型及发布框架,提升能力与效率。模型架构、训练有特色,测试中设备端在部分任务表现优,服务器端欠佳。此前论文引争议,或借此重启 AI 战略。>阅读原文
小米杨永杰:端侧大模型商业化待突破
小米小爱同学端侧AI负责人杨永杰表示,端侧大模型商业化落地慢,受设备资源和模型迭代影响。团队自研推理框架,实现超180 tokens/s速度。未来突破方向在硬件进步和模型架构演进。>阅读原文
Wix 8000 万美元收购 6 个月初创公司 Base44
Wix 收购独立开发者 Maor Shlomo 的 Base44,作价 8000 万美元。这家成立 6 个月、8 人团队的公司用户达 25 万且已盈利。Shlomo 称因规模需求而出售。>阅读原文
Sam Altman反击IYO创始人“求购不成反诉讼”
Sam Altman 发文反击 IYO 诉讼,称其创始人 Jason Rugolo 多次求投资或收购被拒后起诉。邮件显示 OpenAI 早拒绝合作且不看好其产品。不过 Altman 未回应偷创意指控,IYO 称被扼杀。>阅读原文
玻尔兹曼入驻集聚区,反思业务重树信心
玻尔兹曼入驻南京大模型产业集聚区。其24年拿牌照后营收未达预期,反思是运营推广问题,与投资人交流并自我思考后,因业务有增长潜力、刚需及壁垒,坚定发展信心。>阅读原文
字节跳动孔涛离职投身创业
AI科技评论独家消息,字节跳动机器人团队负责人孔涛6月初离职创业,团队有人员流失,字节急招继任者。字节此前加大机器人投入,发布GR - 2模型,业界认为其需更大决心求突破。>阅读原文
OpenAI 65亿收购产品被指抄袭
谷歌X孵化公司IYO起诉OpenAI抄袭,称其65亿美元收购的Jony Ive公司产品和名字均来自自己。此前OpenAI拒绝合作,却私下获取技术方案,Jony Ive声名受损。>阅读原文
招聘市场:AI与AI的激烈对决
招聘市场现AI对决,求职者用AI优化简历、自动申请,企业用AI筛选和面试。还面临虚假身份问题。专家认为双方或追求真实性,应剥离无意义工作。>阅读原文
Sakana AI:小模型也能教出强推理LLM
Sakana AI提出新方法,让教师模型模仿人类启发式教学。其训练的7B小模型传授推理技能超671B的DeepSeek - R1,训练大3倍的学生模型也出色,且成本远低于传统方法。>阅读原文
产品应用
MCP Server+大模型,开启云产品管理新方式
作者介绍MCP Server与大模型结合实现云产品自然语言操作。上手体验有问题,经原理探究和代码验证找到解决办法。后续将多方面优化,未来有望推动文档完善、控制幻觉、建立云产品Agent等。>阅读原文
鸿蒙6:让AI主动干活,开启服务分发新时代
HDC 2025上,鸿蒙展示服务分发新能力,实现服务主动找人。奈雪、东方财富等已加入。华为为开发者提供便捷工具和激励政策,现在是加入鸿蒙生态的好时机。>阅读原文
梅涛团队推vivago2.0,多模态创作神器登场
智象未来推出vivago2.0,集图片、视频、播客生成等功能于一体,有百种特效模板。它依托HiDream - A1,结合HiDream - I1和HiDream - E1能力。团队由梅涛带领,技术强、融资顺,未来聚焦多模态商业化。>阅读原文
北大「码上飞」:对话生成华为鸿蒙应用
北大推出的「码上飞」AI Agent,在华为开发者大会被点名。它能根据自然语言需求全流程自动化开发应用,实测5分钟开发睡眠助手app,降低开发门槛,让个人创造力飞跃。>阅读原文
Kimi深度研究功能:逻辑与数据处理双强
作者测试Kimi深度研究功能,它基于强化学习,将开源模型。分析Labubu爆火、检索小米发布会内容,展现逻辑分析、搜索和数据处理能力,可视化网页贴心,不依赖大Prompt工程。>阅读原文
谷歌发布本地具身智能模型,机器人有离线大脑
谷歌发布本地具身智能模型Gemini Robotics On - Device,可离线运行,解决网络难题。其泛化性能好,适应能力强,开发者用少量样本就能让它适应新任务,还开放SDK降低开发成本。>阅读原文
百度发布文心快码Comate AI IDE
百度副总裁陈洋:6月23日发布文心快码Comate AI IDE,行业首创设计稿一键转代码。其亮点多、功能强,对比Cursor优势显著,适配开发场景,还能助力开发者进阶。>阅读原文
谷歌Gemini:7段纸艺动画治愈焦虑
全球网友热衷解压视频,谷歌Gemini推出7段带提示词的纸艺动画解压视频,靠高精准提示等打造,拓展想象边界,让AI成美学与治愈桥梁。>阅读原文
Kimi - Researcher:Agent 新模型实测惊艳
月之暗面推出端到端强化学习的 Agent 模型 Kimi - Researcher。实测显示它在多方面表现出色,如硬件分析维度更全、解读代码能自主画图等。它与 OpenAI 各有优劣,还指明了 Agent RL 探索方向。>阅读原文
推荐文章
趣解GPU核心参数,小白也能秒懂!
美国升级对英伟达H20芯片出口管制,引发业内震动。文章介绍GPU和显卡区别,讲解关键参数含义,用货车、火车类比助小白理解,助大家选合适GPU。>阅读原文
OpenAI亮出王牌Deep Research!
浙江大学论文梳理Deep Research赛道,它是一类AI系统,背后Agent范式可迁移。文中介绍其技术、架构、应用,还指出面临控制幻觉、保护隐私等挑战,也提及多模态研究等未来方向。>阅读原文
上下文工程崛起,提示工程成过去式
大模型应用发展,技术焦点从提示工程转向上下文工程。上下文工程构建动态系统为模型供信息与工具,其重要性因模型能力提升更突显,未来核心竞争力是高质量上下文。>阅读原文
开源动态
欧洲人发起运动,挑战AI大厂“黑箱”
LAION创始人Jenia Jitsev称,因AI成果被锁“黑箱”,众人联合构建开放数据集、训练模型,成果比肩OpenAI。“爱丽丝梦游仙境”研究揭示大模型泛化问题,或可扩大推理数据规模解决。>阅读原文
谷歌捐A2A,智能体协议竞争升级
谷歌将A2A捐赠给Linux基金会,A2A实现多智能体交互,有开发者认为或削弱MCP地位,谷歌称是其“补充”。专家指出协议可助智能体提可靠性,但应用有难题,盈利转化低。>阅读原文
OmniGen2开源升级,多模态图像生成超惊艳
OmniGen2开源升级,架构升级设独立解码路径。它可实现文本到图像生成、图像编辑等多任务,有任务统一、多模态输入等技术特点,提升图像创作体验。>阅读原文
Spring 之父开源 Embabel 挑战最强 Agent 框架
Spring 之父 Rod Johnson 认为生成式 AI 在企业应用有局限,JVM 社区有优势,为此开源 Embabel 框架。它以 GOAP 保证确定性,有重规划能力,目标是做最好的 Agent 框架,增强人的能力。>阅读原文
谷歌捐 A2A 给 Linux 基金会,协议应用待解
当地时间 6 月 23 日,谷歌将 A2A 捐赠给 Linux 基金会。A2A 支持智能体通信协作,谷歌称将加速其开发普及。开发者认为 A2A 或削弱 MCP 地位,但也有人对两者共存存疑,实际应用还面临诸多问题。>阅读原文
Streaming - KokoroJS:本地运行零隐私泄露TTS工具
传统TTS依赖云端有隐私风险,Streaming - KokoroJS开源TTS工具基于Kokoro - 82M开发,可在浏览器本地运行,零服务器依赖,隐私无忧,功能丰富,适合多场景。>阅读原文
腾讯PhotoMaker:10秒定制真人级头像
腾讯ARC实验室与南开大学发布PhotoMaker:能10秒定制真人级头像,有高保真ID嵌入等功能,V2升级,兼容多插件,适配GPU,部署简单,适用多场景,远超同类。>阅读原文
港大与上海AI Lab推出具身智能框架VLN - R1
港大与上海AI Lab提出VLN - R1框架,打破传统导航链条,以两阶段训练等创新,在测试中展现强性能,小模型可超越大模型,促进AI向具身认知跨越。>阅读原文
阿里巴巴开源手机端3D数字人应用MNN - TaoAvatar
阿里巴巴淘宝Meta团队开源MNN - TaoAvatar应用。它基于TaoAvatar技术,可在手机端运行,具备端侧实时对话和渲染优势,相比主流方案更高效,还对各模块技术进行了深度优化。>阅读原文
阿里夸克开源OmniAvatar音频驱动模型
阿里夸克团队推出OmniAvatar模型,通过多层级音频嵌入等方法解决唇动同步等问题,适用于多场景。不过它也有颜色偏移、长视频误差累积、推理时间长等局限。>阅读原文
哈工大:文本一键生成连贯动画
哈工大发布动画多智能体AniMaker框架,解决AI生成叙事性视频难题。它由多个智能体协作,用MCTS - Gen策略、AniEval框架等,实现文本一键生成连贯动画。>阅读原文
算法论文
陈丹琦团队:PruLong 解放 LLM 内存
陈丹琦团队:长上下文语言模型 KV 缓存大小随输入增长,此前方法难比较。提出「KV 足迹」指标,改进后填充驱逐方法,推出 PruLong 优化内存,KV 足迹降 12%,召回任务性能不变。>阅读原文
北大团队:视频编辑有新招,VIRES超SOTA
北大施柏鑫团队与贝式计算等合作,提出视频实例重绘方法VIRES,标注VireSet数据集。VIRES能实现多种视频编辑操作,在多指标上超现有模型,团队还探索全景级可控视频生成。>阅读原文
复旦BookWorld让小说角色「活」起来
复旦大学:BookWorld系统基于小说构建AI世界,让角色自主互动创造故事。有自主和干预模式,实验超现有方法,未来可成互动娱乐平台,让用户拥有专属小说宇宙。>阅读原文
南大团队:深度表格数据表示学习解析
南京大学团队介绍表格表示学习,把方法分专用、可迁移、通用三类。指出DNN在表格建模复兴,性能逼近传统树模型。还剖析建模挑战,提出评估指标和基准评测,助力构建评估体系。>阅读原文
DnD:几秒定制大模型,效率飙升12000倍
NUS、UT Austin等机构研究人员提出DnD,它是基于提示词的参数生成器,无需训练微调LLM。其计算开销低,性能强,泛化好,速度比传统微调快2500 - 12000倍。>阅读原文
游戏训练AI,数学推理能力大增
莱斯大学等团队研究发现,让多模态大语言模型玩贪吃蛇等游戏,无需数学样本,能显著提升数学等多领域推理能力。ViGaL方法成本低、效果好,或为多模态推理开辟新道路。>阅读原文
SwS框架:强化学习攻克模型推理难题
论文提出 SwS 框架,可利用模型自我感知的弱点驱动自动化问题生成,合成针对性训练数据。对其扩展后,在多测试集和模型验证有效,如 SwS - 32B 性能提升达 25.5%。>阅读原文
合成数据强化学习框架提升大模型性能
北大、MIT等机构提出「合成数据强化学习」框架,仅需任务定义生成合成数据。经实验,其在多领域性能提升显著,超越SFT,媲美人工数据RL,开启大模型适配新范式。>阅读原文
西工大团队:大模型重塑航空科技蓝图
西工大张伟伟团队称,大模型时代下,航空工程教育要转向培养发散思维,科研走向“数据+知识”双驱动,产业链全面智能升级,但应用面临诸多挑战,需多方合作。>阅读原文
ICML 2025:PCL重塑监督学习
上海交大等机构团队在ICML 2025提出PCL,通过扩散模型消减标签信息,将标签学习分解为渐进式任务。实验显示,在多模态任务中,PCL预测精度超传统监督学习,语言任务仍有提升空间。>阅读原文
自适应分类器:文本分类无灾难性遗忘
传统文本分类新增标签易致知识遗忘,而Adaptive classifier通过四项创新解决问题。它利用记忆检索和神经网络决策,可动态添加类别、持续学习,还在幻觉检测、LLM参数配置等场景有应用。>阅读原文
</p>