智源社区 04月12日 18:42
曝GPT-4.1下周发布;宇树机器人格斗,1个月内开打|AI日报
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

本周AI领域动态丰富。OpenAI发布新基准测试BrowseComp,前CTO新公司拟融资20亿美元,ChatGPT更新记忆功能。此外,OpenAI计划发布GPT-4.1,宇树机器人即将开启格斗直播,以及苹果Siri面临困境。中国信通院牵头的大模型基准测试ITU国际标准正式发布,菲律宾出现AI应用欺诈。行业动态持续涌现,展现了AI技术的快速发展与挑战。

🌐 OpenAI发布新基准测试BrowseComp,用于衡量agent在互联网上定位信息的准确性。该测试通过人类训练员创建的高难度问题,推动更可靠的AI研究。

💰 前OpenAI CTO Mira Murati 创立的公司,Thinking Machines Lab,拟融资20亿美元,可能成为科技史上最大种子轮。这反映了尽管存在争议,AI投资热潮依旧强劲。

🤖 宇树机器人G1展示拳击能力,并将在一个月内开启机器人格斗直播。G1机器人不仅可以打沙袋,还可以与人类和其他机器人对打。

🍎 苹果AI Siri面临困境,技术摇摆、团队冲突导致人才流失。苹果在Siri后端的开发上多次技术转向,内部矛盾重重,影响了其发展。

🇨🇳 中国信通院牵头的大模型基准测试ITU国际标准正式发布,规范了大模型基准测试的指标要求和测试方法,推动行业标准化。


速览行业动态
1. OpenAI 开源 agent 网页浏览基准 BrowseComp

2. 前OpenAI CTO新公司拟募资20亿美元,或成科技史最大种子轮

3. ChatGPT 更新:可记住用户过往所有对话信息

4.外媒消息:OpenAI 下周发布 GPT-4.1

5. OpenAI 核心团队揭秘 GPT 4.5 预训练过程

6. 宇树机器人格斗,1 个月内开打

7. 《福布斯》发布 AI 50 强榜单

8. 揭露苹果AI Siri发展困境:技术摇摆、团队冲突致人才流失

9. 菲律宾应用欺诈:AI 产品实则为人工操作

10. 中国信通院牵头的大模型基准测试ITU国际标准正式发布



1. OpenAI 开源 agent 网页浏览基准 BrowseComp

OpenAI 开源了名为 BrowseComp 的新基准测试,旨在衡量 agent 在互联网上定位难找信息的能力。现有基准测试已不能很好地发挥其作用,因为新的模型使测试结果达到了饱和状态,BrowseComp 通过让人类训练员创建极具挑战性、答案简短且唯一的问题来进行测试,涵盖多领域主题。OpenAI 希望通过开源 BrowseComp 推动更可靠的 AI 研究。

2. 前OpenAI CTO新公司拟募资20亿美元,或成科技史最大种子轮

据 Business Insider 报道,由前 OpenAI 首席技术官 Mira Murati 创立的 Thinking Machines Lab 正寻求 20 亿美元的种子轮融资。若成功,这将成为科技史上规模最大的种子轮之一。当前,AI 行业发展态势备受争议,华尔街对 CoreWeave 的首次公开募股反应不一,微软也削减了部分 AI 基础设施项目。在这样的背景下,若 Murati 的公司成功筹集 20 亿美元,将有力证明 AI 投资热潮依旧强劲。

3. ChatGPT 更新:可记住用户过往所有对话信息

OpenAI 宣布对 ChatGPT 进行重大功能更新,显著扩展其定制和记忆能力。此次更新后,ChatGPT 能够记住之前所有对话信息,并据此调整回复,实现更个性化的交互,用户可以随意启用或禁用此功能。该功能目前率先向 ChatGPT Plus 和 Pro 用户推出。

4.外媒消息:OpenAI 下周发布 GPT-4.1

据 The Verge 报道,OpenAI 计划下周发布一系列新的人工智能(AI)模型,其中包括多模态模型 GPT-4o 的改良版——GPT-4.1,以及尺寸更小的 GPT-4.1 mini 和 nano 版本。同时发布 o3 完整版与 o4 迷你版。

消息人士称,最近 OpenAI 由于产能问题延迟了一些新模型的推出,因此 GPT-4.1 的推出时间有可能比原定的下周要迟。此前,Altman 已提醒用户新版本可能存在服务延迟与崩溃。

5. OpenAI 核心团队揭秘 GPT 4.5 预训练过程

OpenAI 在外网发布视频“Pre-Training GPT-4.5”,主要讨论了 OpenAI 训练 GPT-4.5 的过程。涵盖项目启动、挑战、团队合作及有趣发现,还对未来进行了展望。

同时,奥特曼等人还探讨了数据效率瓶颈需要探索算法创新、未来大规模 GPU 同步预训练的可能性、更大预训练模型与学习推理能力的关系、系统进步的限制因素,以及无监督学习有效的原因和度量指标的重要性等问题。


6. 宇树机器人格斗,1 个月内开打

宇树发布机器人 G1 拳击视频,在视频中,G1 不仅展示了打沙袋,还和成年男子以及另外一台 G1 机器人分别进行了对打。尽管 G1 被人类一脚踢倒,但还可以单手撑地很快站起来。视频结尾显示,他们将在近 1 个月左右开启机器人格斗直播。


7. 《福布斯》发布 AI 50 强榜单


8. 揭露苹果AI Siri发展困境:技术摇摆、团队冲突致人才流失

The Information 发布的一篇文章揭露了苹果 AI Siri 改版背后的内部混乱。文章凸显了苹果内部矛盾重重,隐私立场、领导不力、团队冲突等问题。例如,苹果在 Siri 后端开发上摇摆不定,从最初设想构建“Mini Mouse” 与 “Mighty Mouse” 双模型,到决定采用单一大语言模型(LLM),多次技术转向让工程师受挫,部分人员离职


9. 菲律宾应用欺诈:AI 产品实则为人工操作

据 TechCrunch 报道,一位菲律宾金融科技创始人遭到欺诈指控,其所推出的 AI 购物应用,原本宣称利用 AI 技术为用户提供服务,却被发现实际是菲律宾当地人工操作。这一欺诈行为已经误导消费者,损害用户权益,该公司创始人将面临法律追责。


10. 中国信通院牵头的大模型基准测试ITU国际标准正式发布

据财联社消息,国际电信联盟电信标准分局(ITU-T)于 2025 年 3 月正式发布 ITU-T F.748.44 基础模型的评估标准:基准测试/ Assessment criteria for foundation models: Benchmark。该项国际标准由中国信息通信研究院牵头制定,规范了大模型基准测试的指标要求和测试方法。


整理:锦鲤

如需转载或投稿,请直接在公众号内留言

内容中包含的图片若涉及版权问题,请及时与我们联系删除

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

OpenAI ChatGPT Siri 机器人格斗 AI基准测试
相关文章