第一财经杂志 03月10日
Manus受益于上一波推理模型;郭明錤称真正的AI手机需要更大屏幕
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

本文总结了近期AI行业的关键动态。智能体产品Manus因其跨App操作能力迅速走红,OpenAI计划推出不同等级的智能体,最高定价每月2万美元。阿里巴巴开源了通义千问推理模型QwQ-32B,其数学能力可与DeepSeek-R1媲美。Google正在测试AI Mode功能,旨在处理更复杂的搜索查询。此外,苹果首款可折叠iPhone预计将在明后年上市,售价超2000美元。算力服务商CoreWeave提交IPO文件,收入大幅增长,但严重依赖微软。具身智能机器人公司逐际动力完成了5亿元A轮系列融资。2024年图灵奖授予了强化学习领域的两位先驱。

🤖智能体产品Manus的走红,得益于产品层面的精细打磨,而非底层模型能力的提升,它通过调用各类工具,自主执行复杂任务,为用户提供电脑代操作的跨App体验。

💰OpenAI计划推出不同价格的智能体产品,最高端的「博士级」智能体定价每月2万美元,预示着AI智能体商业化的新尝试,也引发了对智能体能力差异和应用场景的关注。

🚀阿里巴巴开源通义千问推理模型QwQ-32B,在数学和代码能力上表现出色,与更大参数量的模型相当,同时集成了与智能体Agent相关的能力,为AI模型的开源生态注入了新的活力。

📱苹果公司计划在明后年推出首款可折叠iPhone,定位为AI手机,采用“书本式”设计,展开后屏幕尺寸约7.8英寸,预示着AI技术与硬件设备的深度融合,或将引领新一轮的智能设备创新。

Key Points

新模型与产品

智能体产品Manus迅速走红,团队另一款产品Monica拥有数百万海外用户;

OpenAI准备为其「博士级」智能体定价每月2万美元;

通义千问开源推理模型QwQ-32B,数学能力不输DeepSeek-R1;

Google测试AI Mode以处理更复杂的查询;

科技行业动向

苹果首款可折叠iPhone将在明后年上市,售价超2000美元;

算力服务商CoreWeave提交IPO文件,去年收入增长7倍,严重依赖微软;

逐际动力半年累计完成5亿元A轮系列融资;

2024年图灵奖颁给了强化学习。

 

新模型与产品

智能体产品Manus迅速走红,团队另一款产品Monica拥有数百万海外用户

3月5日,一款智能体产品Manus在中文AI圈迅速走红。用户只需要告诉它最终目标,Manus就可以灵活调用各类工具,自主执行浏览网页、操作网页应用、编写并执行代码等操作来实现。在官网中,团队提供了Manus的多个用例,包括制定旅行攻略、保险政策比较分析、财报分析、制作课堂演示PPT、文档格式转换、生成小游戏等。

Manus的走红更多得益于在产品层面的打磨,而非底层模型能力的提升。例如在分析某款股票的工作中,Manus一来要调用金融API获取数据,二来要借助Python脚本生成可视化图表,这都需要产品团队提前布置好相应的工具。消息称,团队并未自研模型,而是调用Claude和Qwen等不同模型来执行多样的工作,目前Manus的单任务运行成本约为2美元。

使用Manus过程中,用户能感受到的体验感更多是computer use(电脑代操作类agent)的跨App操作能力及其可视化过程带来的,输出结果的可用性完全有赖于基础模型的能力。当然,最近几个月的一系列推理模型比如GPT o3、DeepSeek R1、QWQ、Claude 3.7 Sonnet等的发布甚至开源,以及Deep Research功能的商用,一定程度上让基础模型降低了幻觉,提升了路径规划能力、深度研究能力和代码写作的准确率。这些能力为财报分析、表格生成、网页和简易游戏的生成等更具生产力的agent提供了可能。Manus为这些能力提供了综合性的体验入口。

Manus团队主要成员包括创始人肖弘、产品合伙人张涛和首席科学家季逸超。该团队上一款AI产品Monica已积累用户数约400万,这是一款套壳类聊天助手。腾讯科技称,该公司目前共完成两轮融资,总规模超过1000万美元。

参考链接

https://manus.im/

 

OpenAI将为其「博士级」智能体定价每月2万美元

3月5日,有媒体称OpenAI将为其智能体产品收取每月最高2万美元的订阅费用,OpenAI预计这类智能体产品将占到未来公司收入的20%至25%。

知情人士称,OpenAI准备推出3档价格不同的智能体。其中,面向高收入知识群体的低端智能体每月订阅价格为2000美元;面向软件开发者的中端智能体为每月1万美元;而高端的「博士级」智能体价格为每月2万美元。

暂不清楚这些不同级别的智能体将有哪些能力差异,目前OpenAI只在今年1月23日推出过一款名为「Operator」的智能体,只有购买每月200美元Pro会员的用户可以体验,它能够代理用户执行基于网页的操作。

参考链接

https://www.theinformation.com/articles/openai-plots-charging-20-000-a-month-for-phd-level-agents?rc=th6t9m

 

通义千问开源推理模型QwQ-32B,数学能力不输DeepSeek-R1

3月6日,阿里巴巴开源了通义千问推理模型QwQ-32B。在数学能力和代码能力的测试评估中,QwQ-32B的表现与参数量约20倍的DeepSeek-R1相当,并超过o1-mini及相同尺寸的R1后续模型。

在多个基准测试中,QwQ-32B参数量不大,但性能上不落后。

通义团队称,在冷启动基础上,QwQ-32B针对数学和编程任务、通用能力分别做了两轮大规模强化学习。在初始阶段,特别针对数学和编程任务进行了强化学习。在第一阶段的强化学习之后,研发人员还增加了另一个针对通用能力的强化学习。最终发现,通过少量步骤的通用强化学习,可以提升其他通用能力,同时在数学和编程任务上的性能没有显著下降。

此外,QwQ-32B模型还集成了与智能体Agent相关的能力,使其能够在使用工具的同时批判性思考,并根据环境反馈调整推理过程。目前,该模型已经在魔搭社区及Hugging Face开源。

参考链接

https://modelscope.cn/models/Qwen/QwQ-32B

https://huggingface.co/Qwen/QwQ-32B

 

Google测试AI Mode功能以处理更复杂的搜索

3月5日,Google开始在搜索中测试一款名为「AI Mode」(AI模式)的新功能,它有点像是之前「AI Overviews」(AI概览)功能的升级版。AI Overviews可以在用户搜索时生成简洁的摘要总结并附上相关链接;但AI Mode更进一步,它基于Gemini 2.0开发,拥有制定计划、调用工具的能力。

官方称,AI Mode帮用户处理复杂问题,给出综合性回答,而不是罗列出一堆网页链接。例如用户问:「智能戒指、智能手表和追踪垫的睡眠追踪功能有什么区别」,AI Mode采用多步骤方法制定查询计划并搜索以查找信息,并根据找到的内容调整答案内容。如果想了解更多信息,用户可以提出后续问题,例如「深度睡眠期间心率会发生什么变化」,以便快速获得易于理解的答复以及相关链接。

参考链接

https://blog.google/products/search/ai-mode-search/

 

科技行业动向

苹果首款可折叠iPhone将在明后年上市,售价超2000美元

3月6日,天风国际证券分析师郭明錤爆料,苹果初代可折叠iPhone将在2026年年底或2027年初上市,预计售价为2000至2500美元。

郭明錤认为,这款可折叠iPhone的定位为真正的AI手机,「多模态与跨App使用为未来AI装置的大趋势,故手机屏幕越大,越有利AI用户体验。例如,与聊天机器人讨论旅游行程时,同时呈现完整的地图App。」

初代可折叠iPhone将采用「书本式」左右折设计。展开手机时,屏幕尺寸约7.8英寸,厚度约4.5-4.8毫米;折叠手机时,屏幕尺寸约5.5英寸,厚度约9-9.6毫米。打开与折叠时各有一个前置相机,后置相机为双镜头。另外,指纹识别功能(Touch ID)将回归,但会被集成在设备的侧边按键上,因厚度与空间限制,预期没有面部识别功能(Face ID)。

郭明錤称,因生产难度非常高,初代可折叠iPhone预计于2026年第四季度量产,放量可能要等到2027年,2026年出货量预计为300万至500万部。第2代可折叠iPhone预计在2027年下半年量产。

参考链接

https://mingchikuo.craft.me/xYHHT2wmZXaD1Z

 

算力服务商CoreWeave提交IPO文件,去年收入增长7倍,严重依赖微软

3月3日,CoreWeave向美国证券交易委员会(SEC)递交IPO文件,计划登陆纳斯达克,股票代码「CRWV」,预计募集金额40亿美元,估值超350亿美元。CoreWeave成立于2017年,是一家算力服务提供商。截至2024年年底,公司拥有32个数据中心,超过25万张GPU,大部分是英伟达H系列芯片。目前,英伟达持有CoreWeave 5.97%的A类股。

文件显示,2022年至2024年,公司收入分别为1583万美元、2.29亿美元和19.15亿美元,净亏损分别为3106万美元、5.94亿美元和8.63亿美元。虽然去年收入同比大幅增长737%,但目前公司严重依赖其最大客户微软。2023年,微软对公司的收入贡献占比为35%,2024年增长至62%。

据外媒去年11月的报道,微软计划在2030年以前与CoreWeave签订总价值约100亿美元的合同。3月6日,有消息称微软撤销了部分协议,CoreWeave已予以否认。CoreWeave其他客户包括对冲基金Jane Street、Meta、IBM、法国大模型公司Mistral AI等。

参考链接

https://secfilings.nasdaq.com/filingFrameset.asp?FilingID=18247628&View=html

 

逐际动力半年累计完成5亿元A轮系列融资

3月6日,具身智能机器人公司逐际动力宣布在近期完成了A+轮融资,加上在去年7月完成的A轮战略融资,该公司在半年内完成累计达5亿元的融资计划。在本轮A+融资中,阿里巴巴、招商局创投、联想创投、彼岸时代等多家公司跟投,来自汽车产业的蔚来资本和上汽集团旗下投资公司尚颀资本也首次参与了融资。

截至目前,逐际动力共完成了4轮融资。除了A轮融资外,逐际动力分别在2022年8月和2023年10月完成了天使轮融资和约2亿元的Pre-A轮融资。天使轮投资方包括峰瑞资本、智数资本、明势资本和昆仲资本。Pre-A轮融资领投方则为绿洲资本,联想创投参投。

逐际动力于2022年在深圳成立,目前产品包括人形双足机器人,双足、四足机器人等。创始人张巍目前是南方科技大学长聘教授,他曾任美国俄亥俄州立大学长聘教授。

 

2024年图灵奖颁给了强化学习

3月5日,美国计算机学会(ACM)宣布,2024年ACM A.M. 图灵奖授予Andrew G. Barto和Richard S. Sutton,以表彰他们在强化学习(Reinforcement Learning)领域的奠基性贡献。Barto是马萨诸塞大学阿默斯特分校信息与计算机科学系的荣休教授,Sutton则是阿尔伯塔大学计算机科学教授,并在Keen Technologies及阿尔伯塔机器智能研究所(Amii)担任研究职务。图灵奖素有「计算机界的诺贝尔奖」之称,奖金100万美元,由Google提供资助。

强化学习的核心思想是通过「奖励」信号来指导智能体的行为,使其在复杂环境中自主学习最优决策。Barto与Sutton自1980年代起就开始了在该领域的研究,他们提出了关键数学框架和核心算法,包括时间差分学习(Temporal Difference Learning)、策略梯度方法(Policy Gradient Methods)等。近年来,该技术在AlphaGo战胜世界顶级围棋选手,以及ChatGPT等先进AI系统的开发中发挥了关键作用。

ACM主席Yannis Ioannidis表示,Barto和Sutton的工作不仅奠定了强化学习的理论基础,还为未来计算机科学的发展提供了无限可能。Jeff Dean(Google高级副总裁)则指出,强化学习直接回应了图灵在1947年提出的「机器应能从经验中学习」的设想,其影响力将持续推动人工智能的创新发展。

参考链接

https://awards.acm.org/about/2024-turing

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

智能体 AI模型 OpenAI 通义千问 可折叠iPhone
相关文章