一支烟花AI 01月28日
一支烟花不定期AI简报--Starlink,DeepSeekV3,AI架构新范式,Gear,非程序员可以学习AIAgent吗?
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

本文涵盖了AI领域的多个方面,包括LeCun对AI架构新范式的预测,微软与OpenAI关系的变化,三星手机的AI功能,Grepr的投资等,还探讨了AI在历史、劳动力等方面的应用及面临的问题。

LeCun预测未来三到五年内将出现新的AI架构范式,且未来几年可能是机器人技术的十年。

微软与OpenAI关系出现裂痕,OpenAI不再是微软的独家云服务提供商。

三星智能家居平台SmartThings将引入AI功能,通过环境感知和生成式AI简化日常生活。

Grepr是可观测性成本优化平台,能在不牺牲可见性的情况下大幅削减开支。

原创 一支烟一朵花 2025-01-25 07:30 上海

 

 

太空中的信号塔:


DeepSeek这下真的出圈儿了:

 

新用户增长理论和反病毒式传播策略:

 


Meta 的 Yann LeCun 预测 5 年内将出现“AI 架构的新范式”和“机器人技术的十年”

Meta 的首席 AI 科学家,Yann LeCun表示,未来三到五年内将出现一种“新的 AI 架构范式”,其能力将远超现有的 AI 系统。 

LeCun 还预测,未来几年可能是“机器人技术的十年”,人工智能和机器人技术的进步将结合,解锁一类新的智能应用。 

在周四达沃斯一场名为“技术辩论”的会议上,LeCun 表示,我们目前所拥有的“AI 风味”——即生成式 AI 和大型语言模型(LLMs)——其实并没有那么强大。它确实有用,但在许多方面仍显不足。 

我认为当前[LLM]范式的保质期相当短,大概三到五年,”LeCun 说。“我认为在五年内,任何理智的人都不会再使用它们,至少不会作为 AI 系统的核心组件。我认为[...]我们将看到 AI 架构新范式的出现,它可能不会受到当前 AI 系统的限制。” 

这些“限制”阻碍了机器实现真正的智能行为,LeCun 说。这归结为四个关键原因:对物理世界的理解不足;缺乏持久记忆;缺乏推理能力;以及缺乏复杂的规划能力。 

“LLMs 确实无法做到这些,”LeCun 说。“因此,未来几年内将会发生另一场 AI 革命。我们可能不得不改变它的名称,因为它可能不会像我们今天理解的那样具有生成性。 

 

“世界模型”

这与 LeCun 过去所倡导的观点相呼应。其核心在于逐渐被称为“世界模型”的概念,这些模型有望帮助机器理解现实世界的动态。这包括具备记忆、常识、直觉、推理能力——这些特质远超当前主要依赖模式识别的系统。 

此前,LeCun 曾表示这可能还需要大约 10 年的时间,但今天的估计让这一目标更接近现实。不过,在这段时间内它能发展到什么程度尚不十分明确。 

“LLMs擅长操纵语言,但不擅长思考,”LeCun 说。“所以这就是我们正在努力的方向——让系统构建世界的心理模型。如果我们正在制定的计划按照我们期望的时间表成功,在三到五年内,我们将拥有完全不同的系统范式。它们可能具备一定程度的常识。它们可能能够通过观察世界并与之互动来学习世界是如何运作的。” 

 

“机器人十年”

尽管生成式人工智能令人印象深刻,能够通过律师资格考试或发现新药物,但 LeCun 认为,在现实世界的这些场景中,机器人技术可能成为下一波人工智能应用的核心组成部分。 

Meta 本身正在机器人领域进行一些研究工作,但当前的人工智能宠儿,ChatGPT 的创造者 OpenAI 也在做同样的事情。本月早些时候,新的职位列表出现,详细描述了一个新的 OpenAI 机器人团队,专注于开发“通用”、“自适应”和“多功能”的机器人,这些机器人能够在现实环境中表现出类似人类的智能。 

“我们没有能像猫那样行动的机器人——理解猫的物理世界远超过我们能用人工智能做到的一切,”他说。“也许接下来的十年将是机器人技术的十年,也许我们将拥有足够聪明的 AI 系统来理解现实世界的运作方式。 

 

 

 

 

微软与 OpenAI 的关系在聘请 Mustafa Suleyman 后出现裂痕

Salesforce CEO Marc Benioff 在达沃斯接受 CNBC 采访时谈到微软与 OpenAI 关系中的新裂痕时,简直是在咯咯笑。作为 OpenAI 计划与软银和甲骨文合作开展一个名为 Stargate 的 5000 亿美元数据中心项目的一部分,微软不再是 OpenAI 的独家云服务提供商。 

“我认为 OpenAI 迅速扩展到其他平台极为重要,因为微软正在构建自己的 AI,我不认为微软未来会使用 OpenAI。他们将拥有自己的前沿模型,”贝尼奥夫笑着预测道。“这就是他们聘请穆斯塔法·苏莱曼的原因。而穆斯塔法·苏莱曼和萨姆·阿尔特曼并不是最好的朋友。” 

贝尼奥夫表示,他们的不和早在一年前的达沃斯论坛上就已显现,“当时山姆和穆斯塔法同台讨论,却相处得并不融洽。” 

微软独家托管 OpenAI 的局面注定要结束。微软在2019 年向 OpenAI 投资了 10 亿美元——这比 OpenAI 在 2022 年底发布 ChatGPT 早了数年。如今,OpenAI 似乎正迈向自己的科技巨头地位,或许有一天能与微软抗衡。OpenAI 还产品延迟归咎于可用计算资源的不足,表明它需要比微软能够(或可能愿意)提供的更多的数据中心容量。而 OpenAI 与微软的独家协议将在 OpenAI 实现双方都认可的 AGI时终止。 

 

一些报告指出,两家公司之间的紧张关系至少从 2023 年年中开始加剧,当时 OpenAI 发布了其自有的竞争性企业产品在 Altman 被解雇并于 2023 年底重新担任 OpenAI CEO后,两家公司的员工向Business Insider表示,他们真的不喜欢一起工作。一些员工称,OpenAI 的员工往往看不起微软的员工。 

仅仅几个月后,2024 年初,纳德拉通过聘请 DeepMind 和 Inflection 联合创始人穆斯塔法·苏莱曼领导微软 AI,予以回击。(微软尚未回应我们的置评请求。) 

尽管贝尼奥夫可能希望微软未来会完全放弃 OpenAI,但这可能只是一厢情愿,尽管微软据报道正在开发自己的LLM,名为 MAI-1。然而,当微软宣布本月早些时候由杰伊·帕里克领导的新 AI 团队将构建 AI 代理和应用时,该公告甚至没有提到 OpenAI。 

此次合作中的最新裂痕对贝尼奥夫来说是个好消息。Salesforce 也使用 OpenAI 的企业模型,并且是 OpenAI 竞争对手 Anthropic 的投资者 

即便如此,贝尼奥夫对苏莱曼的观察并非全无道理。众所周知,苏莱曼对奥特曼的愿景,尤其是在通用人工智能(AGI)方面的看法持保留态度,并在上个月接受The Verge采访时承认,与 OpenAI 的合作关系中“时不时有些小摩擦”。 

 

 

 

三星手机的 AI 功能

周三,三星公布了其智能家居平台SmartThings将如何引入 AI 功能,通过环境感知技术和生成式 AI 让用户简化日常生活。Samsung Unpacked 2025上,该公司表示即将推出的“Home AI”功能将从用户的日常生活中收集洞察,以创建个性化体验。 

三星表示,SmartThings 将利用先进的传感器技术,如用户家中的运动和声音传感器设备,来了解客户的日常活动,如烹饪或睡眠,并创造理想的环境。 

这是一个雄心勃勃的愿景。例如,三星表示,如果用户正在锻炼,SmartThings 将能够检测到正在进行的运动类型,并指导用户正确的姿势。如果用户正在吹干头发,SmartThings 将检测到该动作的声音和运动,并启动该用户的机器人吸尘器来清理掉在地板上的头发。 

或者,在感应到用户的迷你杜宾犬跳上沙发后,SmartThings 可能会启动用户的空气净化器,以清除空气中的过敏原。 

 

至于其生成式人工智能技术,SmartThings 显然将更深入地了解用户的家居环境,从而实现更多个性化定制。 

例如,用户将能够拍摄椅子等物体的照片,以便三星的 Map View 技术——允许用户创建家中的 3D 地图以查找和操作不同的设备——能够实现更直观的交互。例如,SmartThings 可能会根据用户接近某些区域或物体的程度来调整其照明或温度设置。 

 

该公司表示,所有信息都将存储在用户的本地网络中,未经个人同意,任何人的数据都不会存储在云端或向第三方提供访问权限。 

三星表示,这些更新将在 2025 年和 2026 年期间逐步推出。 

 

 

 

A16Z 投资Gear

软件系统的可观测性对于任何非平凡应用都是必需的。但遗憾的是,这并不便宜——有时占基础设施总开支的 10-15%。过去十年间,许多公司在日志、追踪和指标上投入了大量资源,结果却看到月度账单膨胀,且往往超过了所交付的价值。 

然而,尽管我们目睹了可观测性市场以惊人的速度扩张,却鲜有解决方案出现来解决可观测性成本螺旋上升背后的结构性问题。 

这就是为什么我们很高兴宣布对Grepr的投资,这是一个可观测性成本优化平台,帮助公司在不牺牲可见性的情况下大幅削减开支。Grepr 结合了实时数据优化和实用的开发者工具,正是我们相信市场所需要的。 

 

在规模上,可观测性中最大的成本驱动因素之一是冗余数据和对多个目的地的低效路由。Grepr 利用自适应智能分析使用模式,仅路由真正重要的数据。这减少了不必要的复制,同时通过根据需要从对象存储中回填相关数据来保持保真度。 

 

Grepr 还解决了传统采样的缺陷,传统采样为了限制使用量常常丢弃关键见解。Grepr 的方法更为细致,实时检查数据并根据应用重要性、用户行为和服务级别指标进行选择性采样。这确保了关键信号不会在噪音中丢失。 

我们认识 Grepr 的创始人 Jad Naous 已有很长时间,无论是在 a16z 担任合伙人期间,还是在 Imply 和 AppDynamics 担任构建者时。他对复杂企业系统的理解无人能及,并且亲眼目睹了大规模可观测性如何使预算激增。因此,早期试点客户已经报告称,在对现有技术栈进行最小调整的情况下,账单显著降低——这恰恰是因为 Grepr 从一开始就考虑到了这些痛点。 

我们非常高兴能够投资于Grepr的这一轮融资,并再次与 Jad 紧密合作。如果你曾感受到可观测性成本飙升的痛苦——或因成本问题而推迟新的遥测技术应用——那么 Grepr 值得你深入关注。它代表了我们在管理、监控以及最终为维持企业运转的系统付费方式上的下一次进化。在我们如何管理、监控并最终为维持企业运转的系统付费方面,这是下一步的演进。 

 

将可观测性成本降低 90%

无迁移。一行配置更改。 

通过一行配置更改,Grepr 降低了您的可观测性成本并改善了 MTTR。 

保持AI Infra 监控的仪表板、警报、工作流和数据原封不动。 

https://www.grepr.ai/ 

 

整体架构: 

 

特色功能: 

 

 

 

 

reddit 热帖:非程序员能学习/构建 AI Agent吗?

网友回答汇总: 

 

 

 

新论文发现,AI 在历史方面并不擅长

AI 可能在某些任务上表现出色,如编程生成播客。但一项新研究发现,它在通过高级历史考试方面仍有困难。 

一组研究人员创建了一个新的基准来测试三大顶级大型语言模型(LLMs)——OpenAI 的 GPT-4、Meta 的 Llama 和 Google 的 Gemini——在历史问题上的表现。该基准名为 Hist-LLM,根据 Seshat 全球历史数据库测试答案的正确性,这是一个以古埃及智慧女神命名的大型历史知识数据库。 

 

上个月在高规格的人工智能会议 NeurIPS 上展示的结果令人失望,据隶属于奥地利研究机构复杂性科学中心(CSH)的研究人员称。表现最佳的LLM是 GPT-4 Turbo,但其准确率仅达到约 46%——比随机猜测高不了多少。 

“这项研究的主要结论是,LLMs虽然令人印象深刻,但仍缺乏高级历史所需的深度理解。它们对于基本事实非常有用,但在涉及更细致、博士级别的历史探究时,它们还无法胜任,”该论文的合著者之一、伦敦大学学院计算机科学副教授玛丽亚·德尔里奥-查诺纳说道。 

 

研究人员与 TechCrunch 分享了LLMs答错的一些历史问题样本。例如,GPT-4 Turbo 被问及古埃及某一特定时期是否存在鳞甲。LLM回答是,但实际上这种技术在埃及出现的时间晚了 1500 年。 

为什么LLMs在回答技术历史问题时表现不佳,而他们却能很好地回答诸如编码等非常复杂的问题? 

Del Rio-Chanona 告诉 TechCrunch,这可能是因为LLMs倾向于从非常突出的历史数据中推断,发现难以检索到更晦涩的历史知识。 

例如,研究人员询问 GPT-4 古埃及在特定历史时期是否拥有职业常备军。虽然正确答案是没有,但LLM错误地回答说有。这很可能是因为关于其他古代帝国(如波斯)拥有常备军的大量公开信息。 

 

“如果你被告知 A 和 B 100 次,C 1 次,然后被问到一个关于 C 的问题,你可能只记得 A 和 B,并试图从中推断,”del Rio-Chanona 说。 

研究人员还发现了其他趋势,包括 OpenAI 和 Llama 模型在撒哈拉以南非洲等特定地区的表现较差,这表明它们的训练数据可能存在偏见。 

研究结果显示,在某些领域,LLMs仍然无法替代人类,领导这项研究的 CSH 教员彼得·图尔钦表示。 

 

但研究人员仍然希望LLMs能在未来帮助历史学家。他们正在通过纳入更多来自代表性不足地区的数据和添加更复杂的问题来完善他们的基准。 

“总体而言,虽然我们的结果突出了LLMs需要改进的领域,但它们也强调了这些模型在辅助历史研究方面的潜力,”论文中写道。 

 

 

 

Salesforce 董事长贝尼奥夫谈创建无限的人工智能劳动力

 

懂王在达沃斯论坛上与孙正义、Larry Ellison 一同推出“Project Stargate”,并宣称将投入高达 5000 亿美元用于建设数据中心与能源系统,为下一代人工智能提供基础设施支持。虽然这一数字真伪尚待考证,但其背后折射出美国政府与大型科技企业对 AI 竞争力的高度重视:谁能在算力与基础模型上获得先机,谁就能在云计算、大语言模型以及各种企业级应用中抢占更多市场份额。 

 

从 OpenAI 与微软之间的微妙关系变化来看,AI 生态正在加速重组。 

当初微软因巨额投资与 OpenAI 形成深度绑定,但如今微软招揽了曾在 DeepMind、Inflection 等机构任职的 Mustafa Suleyman,并倾力打造新的大模型,显然不再仅满足于与 OpenAI 的合作伙伴角色。OpenAI 则借由 Oracle 方面的资源与技术帮助,开始将核心算力迁移到微软以外的数据中心。这意味着当初的“深度联盟”正面临挑战,也象征着在大模型与云计算赛道上,不同巨头可能出现更加复杂的竞合关系:一方面仍会在部分产品层面合作,另一方面也会在基础模型与云服务上展开激烈竞争。 

 

在全球层面,美国与中国在 AI 方面的较量仍是各界关注的焦点。嘉宾认为,美国就目前而言占据“显著领先”的位置。尤其是 OpenAI、Google 与 Anthropic 等企业在大模型方面的话语权甚重。而 Google 的 Gemini 被视为可能超越 GPT 等主流模型的新一代产品,这更说明美国科技巨头们在前沿技术研发上全力投入。相较之下,中国在大模型的基础研究与技术落地方面虽取得了一定成果,但在生态成熟度与国际影响力上依然存在差距。不过,这并不意味“AI 平权”难以实现。中国拥有庞大的数据基础、众多技术人才以及政策扶持,各类厂商也在积极发展国产大模型,一旦在算法创新或产业化模式上寻找到突破点,或许会迅速缩小与美国的差距。 

 

在企业应用层面,Salesforce 推出的 Agent Force 被视为 AI 技术从概念到实际生产力落地的典型案例。相比微软的 Copilot,Agent Force 不仅能回答问题,还能真正“执行任务”,从而减少企业人工客服的压力,甚至在销售、市场等各部门完成繁琐却又必要的日常运营工作。在传统的业务场景下,大量重复性的任务往往消耗人力,使企业难以在劳动力短缺时实现扩张。Agent Force 这样的“数字劳动力”不仅能解决人力不足的问题,还能使有限的人力资源转向更高价值的岗位。这在未来可能重新定义“就业”与“技能培养”:一些基础与重复性的岗位需求将逐渐缩减,而对 AI 驱动的复合型人才与技术型人才的需求将显著上升。 

 

然而,AI 的应用也带来了监管、道德与能源层面的挑战。首先,社交媒体与信息发布平台在深度伪造(Deepfake)与虚假信息传播问题上已然捉襟见肘,Section 230 是否应当被废除或修改,成为保障内容质量与舆论健康的一大争议点。AI 时代的内容生成与传播速度更为惊人,若平台自身缺乏有效监管,或者无法对其训练数据与生成结果负责,就可能放大错误信息的危害。 

其次,数据中心能源消耗快速上升也是必须正视的问题。若大模型的训练与推理需求继续扩大,而企业又无法通过清洁能源或可控核聚变、SMR(小型模块化反应堆)等技术来有效供能,AI 的大规模商用将面临环境与成本的双重制约。对于拥有数以千计数据中心的大型科技企业而言,在维持算力优势与达成碳中和、森林保护等环境目标之间找到平衡将是长期课题。 

 

最后,嘉宾在达沃斯还提到保护与恢复森林的重要性,并重申了启动“种植一万亿棵树”的宏大计划,目前已经推进到 2000 亿棵规模,并在刚果地区建立了历史上最大的森林保护区。这说明即便是站在企业与科技前沿的人士,也对环境可持续发展抱有高度关注。这种“继续扩张 AI 业务”与“推进生态保护”的双重努力,也是在回应社会对科技企业的更高期待。 

 

我们看到 AI 技术的“耀眼前景”与“潜在风险”在此刻交相呼应。 

一方面,AI 的算力瓶颈、算法突破与应用场景不断涌现; 

另一方面,政治环境、环保与合规要求正构筑新的竞争壁垒。随着中美在 AI 领域的较量不断深化,以及微软、Google、OpenAI、Oracle 等科技巨头关系错综变化,未来的 AI 生态图谱可能会更加离散,多极化竞争趋势将日益凸显。企业在追逐效率与利润的同时,也需要对社会责任、环境影响以及平台治理投入更多资源与关注。只有在监管、伦理与创新之间找到平衡,AI 技术才可能真正发挥出“数字劳动力革命”的最大价值,亦能在医疗、教育、金融等诸多领域继续创造福祉。可以预见,未来 2-3 年内,无论是国际格局还是产业格局,都将因 AI 的快速演化而发生深远变革。 

Project Stargate与AI大举投资

Project Stargate:背景和伙伴关系 特朗普与孙正义(Sam Masa Masa Yoshi’s son,实为孙正义)以及Larry Ellison(甲骨文创始人)宣布“Project Stargate”,号称要投资5000亿美元(主持人也表示这一数字尚不清楚是否真实),用于建设新的数据中心和能源来源,支撑下一代AI和美国竞争力。 

关键原句 

“…Trump appeared with Sam mman Masa Masa Yoshi’s son and and your Mentor Larry Ellison to announce project Stargate … to build new data centers and sources of energy to support the next generation of AI…” 

OpenAI与微软关系的“破裂” 嘉宾透露,这是OpenAI首次不使用微软的数据中心,这背后原因在于微软自己在大举投资Mustafa Suleyman(前DeepMind、Inflection联合创始人)所带领的大模型研发团队,可能造成OpenAI和微软的合作关系出现分歧。Oracle(Larry Ellison的公司)似乎扮演了新的技术与资金伙伴角色。 

关键原句 

“I think it's a big moment in the history of open AI that they're not running on a Microsoft data center.” 


美国与中国的AI竞争

是否存在“AI平权” 主持人问到中美是否存在AI平等竞争的问题,嘉宾认为目前美国仍占据明显优势,尤其在最前沿的大模型研发上。市面上主要竞争者包括Google、OpenAI、Anthropic,并提到了Salesforce对Anthropic的投资。 

关键原句 

“I don't think there is AI parity today… the US has a definitive lead…” 

Google的Gemini 嘉宾提到Google正推出的Gemini模型,“it’s probably ahead”,暗示Google的新模型可能领先于竞争对手。 

关键原句 

“Neil Ferguson just wrote… Google so Gemini is as a player now… it’s probably ahead.” 


 

Salesforce的Agent Force:AI代理在实际业务中的落地

Agent Force的概念与价值 嘉宾大力推介了Salesforce的新技术“Agent Force”,它相较于微软的Copilot,仅仅是“repackaged ChatGPT”,Agent Force更能直接帮助企业完成销售、服务、客服等业务工作。例如在Salesforce的客户支持场景中,大大减少了人工介入的需求。 

关键原句 

“All co-pilot is is repackaged ChatGPT… Agent Force is really what AI was meant to be…” 

提升生产力与减少人力需求 通过Agent Force,“我们”的人工客服工作量从需要1万人到可能只需要几千人,其他人力可以被调配去做更多创造性或增值的工作。 

关键原句 

“…with Agent Force only 5,000 are going off to human beings… that’s a very exciting moment that AI and agents can… give us this incredible productivity…” 

客户案例:校园书店与高峰期人力 嘉宾列举了一个实际案例:一家名为Wy(音)的课本经销商在开学季通常要聘用大量临时客服人员,但采用Agent Force后无需招聘额外人员。 

关键原句 

“…they have this moment every year called back to school… This is the year they did not have to do it… they had the ability to just scale their sales and service…” 


AI投资热潮与前景

是否过度投资? 主持人提及Anthropic近期又从Google获得10亿美元投资,嘉宾认为市场对AI的热情主要来自AI带来的潜在“无限生产力”,并且谈到了他自己如何用AI辅助编写年度商业计划,认为它能大幅度提升领导者的思考深度和企业效率。 

关键原句 

“I've been shocked at how it's impacted me… it has made me more productive but also expands my own consciousness on what I should be doing…” 

 

对医疗突破的展望 嘉宾提到Larry Ellison预测AI有望在48小时内(确切含义为患者确诊后48小时内)针对性设计癌症疫苗,尽管尚未实现,但这一愿景令人期待。 

关键原句 

“…use AI to have much more affinity on what’s really going on and then be able to use the mRNA technology to develop a highly personalized vaccine for that cancer…” 


社交媒体与内容监管

关于Section 230和监管问题 嘉宾过去曾对社交媒体平台上的虚假信息提出担忧,现在更提及需要重新审视美国《通信规范法》第230条款(Section 230)的合理性,让社交平台承担更多内容责任。他也表示,随着AI时代到来,监管需进一步升级。 

关键原句 

“we need to continue to look at from the fundamental reshaping of… section 230… especially with the age of AI…” 


可持续性:从种树到数据中心能源

“一万亿棵树”目标与进展 嘉宾在此前的达沃斯会议上承诺种植1万亿棵树的计划,目前进展到2000亿棵规模。此外,本次访谈也提到在刚果建立了历史上最大的森林保护区。 

关键原句 

“…announcing that we’re delivering the largest Forest Reserve in Earth history in the Congo…” 

AI数据中心的能源消耗 主持人质疑AI数据中心的能耗会大幅增加,嘉宾认为还需进行更多清洁能源、核能乃至聚变能方面的探索。Salesforce本身在进行AI部署时相对并不消耗那么多能源,但他承认行业整体需要更加注重能效问题。 

关键原句 

“I think for everybody there’s probably an opportunity for another level of efficiency…” 



 

 


阅读原文

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

AI架构范式 微软OpenAI 三星AI功能 Grepr
相关文章