Key Points
应用与模型
● 荣耀推出手机端智能体,可以学习用户行为并调用第三方应用;
● 亚马逊有声读物业务Audible将使用AI生成有声读物;
● 德国AI初创公司Aleph Alpha退出基础模型竞争;
● 文心一言市场负责人否认放弃通用大模型开发;
● 传特斯拉将获得xAI的模型许可来开发汽车自动驾驶技术FSD,马斯克否认;
● 元宇宙游戏开发平台Roblox计划推出3D基础模型。
应用与产品
荣耀推出手机端智能体,可以学习用户行为并调用第三方应用
9月5日晚,荣耀在柏林举行的欧洲消费电子展(IFA)上推出了新款折叠屏Magic V3、笔记本产品MagicBook Art 14、平板电脑产品MagicPad 2。同时,荣耀发布了名为「荣耀AI Agent」的跨应用开放生态智能体,计划在下一代旗舰机型荣耀Magic7系列上落地商用。
「荣耀AI Agent」具备「自然语义理解和计算机视觉」「用户行为习惯学习及场景环境感知」「意图识别及决策」以及「应用内及跨应用操作」四项能力,可以自动学习并识别用户在手机页面上的不同操作,且能够调动第三方应用。
在IFA展会现场,荣耀展台的工作人员展示了AI Agent应用场景,例如通过语音指令激活「荣耀AI Agent」后,可实现一键关闭自动续费、一键点饮品、一键旅行规划与订票等功能。
参考链接
https://www.honor.com/cn/news/honor-ai-agent/
亚马逊有声读物业务Audible将使用AI生成有声读物
本周一,亚马逊的有声读物业务Audible宣布,将邀请一部分专业朗读者,使用他们的配音训练AI,用于生成新的有声读物录音,加快有声读物制作速度。这些朗读者可以免费构建他们的声音复制品,并使用亚马逊的制作工具编辑AI语音的发音和节奏,检查最终制作中是否有错误。
亚马逊称,由朗读者的声音训练而成的AI声音应用到有声读物后,朗读者将通过「逐部作品」的「版税分成模式」获得报酬,但没有透露配音演员可以赚取多少钱。亚马逊还表示,未经朗读者同意,Audible不会使用他们的语音复制品制作任何内容。
参考链接
https://www.theverge.com/2024/9/9/24239903/amazon-audible-audiobook-narrators-ai-generated-voice-clones
模型进展
德国AI初创公司Aleph Alpha退出基础模型竞争
9月5日,德国AI初创公司Aleph Alpha在公布其生成式AI解决方案PhariaAI的同时宣布了战略转型:仍计划开发大语言模型,但它不再是其商业战略的核心,也不会再试图超越OpenAI或Meta等公司的模型。
Aleph Alpha公司CEO Jonas Andrulis在采访中表示,大模型领域的昂贵计算竞赛是公司战略转型的因素。调整战略后,Aleph Alpha不再花费巨额资金研发AI模型。
Aleph Alpha成立于2019年,由前苹果和德勤的高管创立,该公司将自己定位为一家维护透明度、自主性和监管合规性等「欧洲价值观」的尖端AI初创公司。2022年4月,Aleph Alpha发布了Luminous,这是一个旨在解析和生成五种语言的图像和文本的AI模型。7个月后,OpenAI推出ChatGPT。
参考链接
https://www.bloomberg.com/news/articles/2024-09-05/the-rise-and-pivot-of-germany-s-one-time-ai-champion
文心一言市场负责人否认放弃通用大模型开发
近日,网传百度文心一言背后的通用大模型将被放弃。针对传言,文心一言市场部负责人张全文9月9日在朋友圈发文称,「所谓放弃通用大模型研发纯属谣言!文心一言刚完成了功能全面升级。我们将持续加大在通用大模型领域的研发投入。」
文心一言是百度的知识增强大语言模型,能够与人对话互动、回答问题、协助创作,高效便捷地帮助人们获取信息。9月4日,百度文心一言App获推4.0.0版本升级,更新日志显示,文心一言升级为「文小言」,号称「功能更强大,场景更丰富」。
传特斯拉将获得xAI的模型许可来开发汽车自动驾驶技术FSD,马斯克否认
9月8日有媒体报道称,特斯拉将获得xAI的模型许可,以支持FSD(完全自动驾驶)的开发,并与xAI分享部分收入。知情人士称,xAI还将协助特斯拉开发其他功能,包括电动汽车内的语音助手和驱动人形机器人Optimus的软件。而xAI和特斯拉之间如何分享收入,部分取决于特斯拉对xAI技术的依赖程度。xAI是马斯克旗下一家生成式AI公司。
随后,马斯克在社交平台X上回应称上述报道不准确,并解释了xAI模型和特斯拉汽车所用模型的差异。马斯克表示,特斯拉没有必要从xAI获得任何技术许可。xAI模型非常庞大,压缩了大部分人类知识,不可能在特斯拉汽车的推理计算机上运行。特斯拉AI模型将现实视频压缩成驾驶命令,虽然具有难以置信的「压缩密度」,但必须在内存大小和带宽远低于H100 GPU的约300W计算机上运行。
参考链接
https://www.wsj.com/tech/tesla-xai-partnership-elon-musk-30e22313
https://x.com/elonmusk/status/1832618127189774374
元宇宙游戏开发平台Roblox计划推出3D模型,可以通过提示词生成3D场景
9月6日,美国元宇宙游戏开发平台Roblox宣布将推出一款3D基础模型,让游戏开发者仅使用文本提示即可制作3D场景。Roblox尚未透露模型上线时间,但表示会将其开源。
该3D模型工作原理与大语言模型类似,它会根据输入,评估下一个最有可能的3D块。训练该模型需要标记数百万个3D块,Roblox使用了游戏创作者生成的用户数据和外部数据集。但3D环境的数据比文本少得多,该公司AI部门的副总裁Anupam Singh表示,「寻找高质量的3D信息非常困难,即使获得了所有能想到的数据集,要预测下一个立方体也需要三个维度,即X、Y和Z。」
参考链接
https://www.technologyreview.com/2024/09/06/1103707/roblox-is-launching-a-generative-ai-that-builds-3d-environments-in-a-snap/