AI Daily | AI日报：Replit ARR破亿，Agent助力6月增10倍; 韩国核灾难机器人：丑却实用潜力大; Wix 8000万美元收购AI平台Base44

All in AI，看见未来。每天精选最值得读的AI文章，帮你筛掉时代的噪音。以简讯见广度，以深读见洞察。技术、趋势、思考，一站式掌握AI世界。欢迎关注公众号「AI Reading Hub」，获取更多AI资讯和技术文章。

2025-06-25 资讯日报

新闻资讯

Replit ARR破亿，Agent助力6月增10倍

Replit 宣布 ARR 突破 1 亿美金，从 1000 万到 1 亿仅 6 个月。它始于 2016 年，早期营收差，2024 年 9 月推 Agent 产品，转变编程模式，实现 ARR 10 倍增长。>阅读原文

韩国核灾难机器人：丑却实用潜力大

韩国原子能研究院开发核灾难处理人形机器人，目标举200公斤重物，远超多数同类。虽有人担忧辐射影响，但现代防护技术有进步。实用性强，长期测试后或带来核废料处理革命。>阅读原文

Wix 8000万美元收购AI平台Base44

著名SaaS平台Wix以8000万美元收购AI开发平台Base44。Base44核心产品简单易用，虽用户仅几千人，但商业表现亮眼。收购后Wix业务拓展，向对话式AI平台转型。>阅读原文

Delphi获融资，让数字心智传承智慧

Delphi获红杉1600万美元融资，创始人受中风祖父回忆录启发创业。其核心是捕捉思维方式，非简单克隆。能应用于多场景创收，重新定义传承，让智慧活在对话里。>阅读原文

OpenAI：弃iyO收购io，进军AI硬件

OpenAI Sam Altman公布邮件，显示收购io为开发硬件语音AI Agent。iyO邀投资合作，演示失败被弃。双方因名字打官司，或庭外和解，iyO获赔偿。>阅读原文

Der8auer 改装 RTX 5090 击败 RTX Pro 6000

硬件改装大师 Der8auer 用 Shunt mod 改装华硕 ROG Astral LC RTX 5090，解锁功率限制提升性能，超越 RTX Pro 6000，但改装有风险，更适用于液冷显卡。>阅读原文

谷歌推可本地运行的具身Gemini模型

谷歌DeepMind推出Gemini Robotics On-Device，可本地运行于机器人，适应新任务。还将发SDK助开发者。同时下调Gemini免费额度，推出图像生成模型Imagen 4和Imagen 4 Ultra，离具身智能时代更近。>阅读原文

苹果：更新模型加强生成式 AI 布局

苹果更新 AFM 系列模型及发布框架，提升能力与效率。模型架构、训练有特色，测试中设备端在部分任务表现优，服务器端欠佳。此前论文引争议，或借此重启 AI 战略。>阅读原文

小米杨永杰：端侧大模型商业化待突破

小米小爱同学端侧AI负责人杨永杰表示，端侧大模型商业化落地慢，受设备资源和模型迭代影响。团队自研推理框架，实现超180 tokens/s速度。未来突破方向在硬件进步和模型架构演进。>阅读原文

Wix 8000 万美元收购 6 个月初创公司 Base44

Wix 收购独立开发者 Maor Shlomo 的 Base44，作价 8000 万美元。这家成立 6 个月、8 人团队的公司用户达 25 万且已盈利。Shlomo 称因规模需求而出售。>阅读原文

Sam Altman反击IYO创始人“求购不成反诉讼”

Sam Altman 发文反击 IYO 诉讼，称其创始人 Jason Rugolo 多次求投资或收购被拒后起诉。邮件显示 OpenAI 早拒绝合作且不看好其产品。不过 Altman 未回应偷创意指控，IYO 称被扼杀。>阅读原文

玻尔兹曼入驻集聚区，反思业务重树信心

玻尔兹曼入驻南京大模型产业集聚区。其24年拿牌照后营收未达预期，反思是运营推广问题，与投资人交流并自我思考后，因业务有增长潜力、刚需及壁垒，坚定发展信心。>阅读原文

字节跳动孔涛离职投身创业

AI科技评论独家消息，字节跳动机器人团队负责人孔涛6月初离职创业，团队有人员流失，字节急招继任者。字节此前加大机器人投入，发布GR - 2模型，业界认为其需更大决心求突破。>阅读原文

OpenAI 65亿收购产品被指抄袭

谷歌X孵化公司IYO起诉OpenAI抄袭，称其65亿美元收购的Jony Ive公司产品和名字均来自自己。此前OpenAI拒绝合作，却私下获取技术方案，Jony Ive声名受损。>阅读原文

招聘市场：AI与AI的激烈对决

招聘市场现AI对决，求职者用AI优化简历、自动申请，企业用AI筛选和面试。还面临虚假身份问题。专家认为双方或追求真实性，应剥离无意义工作。>阅读原文

Sakana AI：小模型也能教出强推理LLM

Sakana AI提出新方法，让教师模型模仿人类启发式教学。其训练的7B小模型传授推理技能超671B的DeepSeek - R1，训练大3倍的学生模型也出色，且成本远低于传统方法。>阅读原文

产品应用

MCP Server+大模型，开启云产品管理新方式

作者介绍MCP Server与大模型结合实现云产品自然语言操作。上手体验有问题，经原理探究和代码验证找到解决办法。后续将多方面优化，未来有望推动文档完善、控制幻觉、建立云产品Agent等。>阅读原文

鸿蒙6：让AI主动干活，开启服务分发新时代

HDC 2025上，鸿蒙展示服务分发新能力，实现服务主动找人。奈雪、东方财富等已加入。华为为开发者提供便捷工具和激励政策，现在是加入鸿蒙生态的好时机。>阅读原文

梅涛团队推vivago2.0，多模态创作神器登场

智象未来推出vivago2.0，集图片、视频、播客生成等功能于一体，有百种特效模板。它依托HiDream - A1，结合HiDream - I1和HiDream - E1能力。团队由梅涛带领，技术强、融资顺，未来聚焦多模态商业化。>阅读原文

北大「码上飞」：对话生成华为鸿蒙应用

北大推出的「码上飞」AI Agent，在华为开发者大会被点名。它能根据自然语言需求全流程自动化开发应用，实测5分钟开发睡眠助手app，降低开发门槛，让个人创造力飞跃。>阅读原文

Kimi深度研究功能：逻辑与数据处理双强

作者测试Kimi深度研究功能，它基于强化学习，将开源模型。分析Labubu爆火、检索小米发布会内容，展现逻辑分析、搜索和数据处理能力，可视化网页贴心，不依赖大Prompt工程。>阅读原文

谷歌发布本地具身智能模型，机器人有离线大脑

谷歌发布本地具身智能模型Gemini Robotics On - Device，可离线运行，解决网络难题。其泛化性能好，适应能力强，开发者用少量样本就能让它适应新任务，还开放SDK降低开发成本。>阅读原文

百度发布文心快码Comate AI IDE

百度副总裁陈洋：6月23日发布文心快码Comate AI IDE，行业首创设计稿一键转代码。其亮点多、功能强，对比Cursor优势显著，适配开发场景，还能助力开发者进阶。>阅读原文

谷歌Gemini：7段纸艺动画治愈焦虑

全球网友热衷解压视频，谷歌Gemini推出7段带提示词的纸艺动画解压视频，靠高精准提示等打造，拓展想象边界，让AI成美学与治愈桥梁。>阅读原文

Kimi - Researcher：Agent 新模型实测惊艳

月之暗面推出端到端强化学习的 Agent 模型 Kimi - Researcher。实测显示它在多方面表现出色，如硬件分析维度更全、解读代码能自主画图等。它与 OpenAI 各有优劣，还指明了 Agent RL 探索方向。>阅读原文

开源动态

欧洲人发起运动，挑战AI大厂“黑箱”

LAION创始人Jenia Jitsev称，因AI成果被锁“黑箱”，众人联合构建开放数据集、训练模型，成果比肩OpenAI。“爱丽丝梦游仙境”研究揭示大模型泛化问题，或可扩大推理数据规模解决。>阅读原文

谷歌捐A2A，智能体协议竞争升级

谷歌将A2A捐赠给Linux基金会，A2A实现多智能体交互，有开发者认为或削弱MCP地位，谷歌称是其“补充”。专家指出协议可助智能体提可靠性，但应用有难题，盈利转化低。>阅读原文

OmniGen2开源升级，多模态图像生成超惊艳

OmniGen2开源升级，架构升级设独立解码路径。它可实现文本到图像生成、图像编辑等多任务，有任务统一、多模态输入等技术特点，提升图像创作体验。>阅读原文

Spring 之父开源 Embabel 挑战最强 Agent 框架

Spring 之父 Rod Johnson 认为生成式 AI 在企业应用有局限，JVM 社区有优势，为此开源 Embabel 框架。它以 GOAP 保证确定性，有重规划能力，目标是做最好的 Agent 框架，增强人的能力。>阅读原文

谷歌捐 A2A 给 Linux 基金会，协议应用待解

当地时间 6 月 23 日，谷歌将 A2A 捐赠给 Linux 基金会。A2A 支持智能体通信协作，谷歌称将加速其开发普及。开发者认为 A2A 或削弱 MCP 地位，但也有人对两者共存存疑，实际应用还面临诸多问题。>阅读原文

Streaming - KokoroJS：本地运行零隐私泄露TTS工具

传统TTS依赖云端有隐私风险，Streaming - KokoroJS开源TTS工具基于Kokoro - 82M开发，可在浏览器本地运行，零服务器依赖，隐私无忧，功能丰富，适合多场景。>阅读原文

腾讯PhotoMaker：10秒定制真人级头像

腾讯ARC实验室与南开大学发布PhotoMaker：能10秒定制真人级头像，有高保真ID嵌入等功能，V2升级，兼容多插件，适配GPU，部署简单，适用多场景，远超同类。>阅读原文

港大与上海AI Lab推出具身智能框架VLN - R1

港大与上海AI Lab提出VLN - R1框架，打破传统导航链条，以两阶段训练等创新，在测试中展现强性能，小模型可超越大模型，促进AI向具身认知跨越。>阅读原文

阿里巴巴开源手机端3D数字人应用MNN - TaoAvatar

阿里巴巴淘宝Meta团队开源MNN - TaoAvatar应用。它基于TaoAvatar技术，可在手机端运行，具备端侧实时对话和渲染优势，相比主流方案更高效，还对各模块技术进行了深度优化。>阅读原文

阿里夸克开源OmniAvatar音频驱动模型

阿里夸克团队推出OmniAvatar模型，通过多层级音频嵌入等方法解决唇动同步等问题，适用于多场景。不过它也有颜色偏移、长视频误差累积、推理时间长等局限。>阅读原文

哈工大：文本一键生成连贯动画

哈工大发布动画多智能体AniMaker框架，解决AI生成叙事性视频难题。它由多个智能体协作，用MCTS - Gen策略、AniEval框架等，实现文本一键生成连贯动画。>阅读原文

算法论文

陈丹琦团队：PruLong 解放 LLM 内存

陈丹琦团队：长上下文语言模型 KV 缓存大小随输入增长，此前方法难比较。提出「KV 足迹」指标，改进后填充驱逐方法，推出 PruLong 优化内存，KV 足迹降 12%，召回任务性能不变。>阅读原文

北大团队：视频编辑有新招，VIRES超SOTA

北大施柏鑫团队与贝式计算等合作，提出视频实例重绘方法VIRES，标注VireSet数据集。VIRES能实现多种视频编辑操作，在多指标上超现有模型，团队还探索全景级可控视频生成。>阅读原文

复旦BookWorld让小说角色「活」起来

复旦大学：BookWorld系统基于小说构建AI世界，让角色自主互动创造故事。有自主和干预模式，实验超现有方法，未来可成互动娱乐平台，让用户拥有专属小说宇宙。>阅读原文

南大团队：深度表格数据表示学习解析

南京大学团队介绍表格表示学习，把方法分专用、可迁移、通用三类。指出DNN在表格建模复兴，性能逼近传统树模型。还剖析建模挑战，提出评估指标和基准评测，助力构建评估体系。>阅读原文

DnD：几秒定制大模型，效率飙升12000倍

NUS、UT Austin等机构研究人员提出DnD，它是基于提示词的参数生成器，无需训练微调LLM。其计算开销低，性能强，泛化好，速度比传统微调快2500 - 12000倍。>阅读原文

游戏训练AI，数学推理能力大增

莱斯大学等团队研究发现，让多模态大语言模型玩贪吃蛇等游戏，无需数学样本，能显著提升数学等多领域推理能力。ViGaL方法成本低、效果好，或为多模态推理开辟新道路。>阅读原文

SwS框架：强化学习攻克模型推理难题

论文提出 SwS 框架，可利用模型自我感知的弱点驱动自动化问题生成，合成针对性训练数据。对其扩展后，在多测试集和模型验证有效，如 SwS - 32B 性能提升达 25.5%。>阅读原文

合成数据强化学习框架提升大模型性能

北大、MIT等机构提出「合成数据强化学习」框架，仅需任务定义生成合成数据。经实验，其在多领域性能提升显著，超越SFT，媲美人工数据RL，开启大模型适配新范式。>阅读原文

西工大团队：大模型重塑航空科技蓝图

西工大张伟伟团队称，大模型时代下，航空工程教育要转向培养发散思维，科研走向“数据+知识”双驱动，产业链全面智能升级，但应用面临诸多挑战，需多方合作。>阅读原文

ICML 2025：PCL重塑监督学习

上海交大等机构团队在ICML 2025提出PCL，通过扩散模型消减标签信息，将标签学习分解为渐进式任务。实验显示，在多模态任务中，PCL预测精度超传统监督学习，语言任务仍有提升空间。>阅读原文

自适应分类器：文本分类无灾难性遗忘

传统文本分类新增标签易致知识遗忘，而Adaptive classifier通过四项创新解决问题。它利用记忆检索和神经网络决策，可动态添加类别、持续学习，还在幻觉检测、LLM参数配置等场景有应用。>阅读原文

    </p>

官网：www.AiReadingHub.com