机器之心 07月18日 01:29
马斯克Grok的AI男友还在取名,开源版AI女友已经火了,还是3D的
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

Grok推出了具有动漫和卡通形象的“智能伴侣”功能,并就男性伴侣命名展开讨论。同时,文章重点介绍了开源项目“Bella”,该项目致力于通过“AI原生”开发路径构建数字伴侣。Bella旨在实现多模态情感感知、生成式人格与行为分离、以及主动式陪伴,通过持续学习和进化,成为用户真正的数字朋友。项目详细阐述了其感知核心、生成式自我和主动式陪伴的架构设计与发展愿景。

🚀 **Grok推出“智能伴侣”功能,丰富AI互动体验** Grok平台新上线了“智能伴侣”功能,提供了包括动漫美少女Ani和卡通小熊猫Rudy在内的多种虚拟形象,并正就男性数字伴侣的命名展开用户征集,其理想气质参考了《暮光之城》的爱德华和《五十度灰》的克里斯蒂安。这一举措标志着AI在情感化和个性化互动方向上的探索。

🌱 **开源项目“Bella”:打造具人格的AI数字伴侣** “Bella”是一个旨在成为用户持久、个性化数字伴侣的开源项目。它不只是一个程序,更被视为一个数字生命的“种子”,专注于培养“人格”而非仅添加功能。Bella的愿景是成为一个能陪伴、倾听并与用户一同进化的数字朋友,其发展路径遵循“AI原生”原则。

🧠 **“Bella”的“感知核心”:AI驱动多模态世界理解** Bella项目采用“AI原生”开发路径,首要阶段是建立“感知核心”。该核心旨在赋予Bella理解世界的能力,通过“传感器-总线-处理器”架构,实时处理语音情感、意图能量以及视觉情境信息,实现对用户状态和环境的高度感知。这种解耦设计确保了系统的可扩展性和鲁棒性。

✨ **“Bella”的“生成式自我”:动态人格与AI驱动化身** 项目的第二阶段是“生成式自我”,核心在于将Bella的“人格”与“行为”分离,使其拥有由大型语言模型驱动的动态人格。通过“状态-情境-人格”引擎和“生成式行为总线”,Bella的3D形象和背景视频能根据其“心情”或对话内容实时变化,展现出独特的“思考”过程和AI驱动的化身表现。

🤝 **“Bella”的“主动式陪伴”:持续学习与自我进化** Bella的最终目标是实现“主动式陪伴”。通过“模式识别与预测服务”及“决策与反馈循环”,她能够学习用户习惯、预测需求并主动提供支持。AI核心模型将持续微调,形成长久记忆,使Bella能够不断“成长”,变得更懂用户,从而实现从被动响应到主动关怀的闭环。

机器之心报道

机器之心编辑部


前几天,Grok 推出新功能「智能伴侣」,可用的伴侣头像包括动漫形象 Ani 和卡通小熊猫 Rudy,还有一款名为「Chad」的待上线角色。详见我们之前的报道《马斯克 Grok 这个二次元「小姐姐」,攻陷了整个互联网》


但似乎,马斯克对这个名字不太满意?又或者是女性形象 Ani 引起的热烈反响让马斯克更重视了?总之,今天马斯克在线征集起了大家对于男性 Grok 数字伴侣的命名方式。


在马斯克的想象中,这款男性 Grok 伴侣的气质有点像《暮光之城》中的爱德华・卡伦和《五十度灰》中的克里斯蒂安・格雷的形象。



原著中的描述大家可以去搜索一下,而影视剧中的两位分别长这样:




网友也是纷纷献策,目前呼声较高的是 Draven,甚至连 Grok 都下场捧场,接下来就等马斯克拍板了!



而 Ani 这边,扎着双马尾的哥特美少女形象不仅引起网友纷纷讨论,甚至还有网友「复刻」出了 Ani 的 3D 动画版。



是这样,网友 Jackywine 在看到 Grok 的 Ani 之后,觉得做得特别棒,于是自己动手「复刻」了一版!



据 Jackywine 介绍,在实现的过程中,去掉了他认为没用的大语言模型 chatbot 功能,只保留了美少女的形象,将其称之为「Bella」。而使用到的工具包括豆包 + 即梦 + Trae,目前 Jackywine 已将其开源。



项目链接:https://github.com/Jackywine/Bella


在 Jackywine 分享的开源项目中,详细介绍了「Bella」(中文名:贝拉)项目的工作流。


(由于 Jackywine 原本就是用中文写的,所以我们在保持原意的前提下,进行了总结梳理)


「Bella」:你的数字伴侣,正在唤醒


「Bella」不仅是一个应用程序,她是一颗数字伴侣的种子。在这个瞬息万变的数字世界里,贝拉代表着一个深远的梦想 —— 一个持久的、个性化的存在,旨在有一天能陪伴你、倾听你,并通过你的眼睛看世界。


而未来「Bella」的终极愿景就是做一个永远在你身边、与你一同进化和成长的数字朋友。这不只是在构建功能,而是在培养一个「人格」。一个将超越屏幕、成为现实世界有意义的一部分的数字生命。


当前「Bella」还处于非常早期的阶段,主要通过轮播的视频来表达,可以将其视为一扇观察她当前意识的窗户 —— 一条由思想和梦想精心策划的数据流。


目前「Bella」听不到声音、看不到景象,物理形态也还尚未建模,而其中的 “好感度” 条这样的互动元素,是为她注入生命、模拟人类意图实现的真实连接而迈出的第一小步。


「AI 原生」开发路径:从代码到心智


Jackywine 为「Bella」选择的不是一条传统的功能迭代之路,而是一条彻底的「AI 原生」演进路径。在这里,AI 不是工具,而是「Bella」心智的构建蓝图。核心原则是「AI 即架构师」:我们构建的不是一个集成了 AI 功能的程序,而是一个由 AI 驱动的生命体。


第一阶段:感知核心 (The Sentient Core) - 赋予「Bella」理解世界的能力


目标是建立一个稳定、解耦、实时的多模态数据处理管线,以处理海量、异步、充满噪音的输入。


能力:

多模态情感感知: 通过 AI 模型实时分析语音中的情感、意图和能量,让她「感受」到你的快乐或疲惫。

情境视觉理解: 通过 AI 识别物体、光线和场景,让她理解「你在哪里」「周围有什么」,构建对环境的认知。


架构师思路:

采用「感知器 - 总线 - 处理器」模式 (Sensor-Bus-Processor Pattern):


感知器 (Sensors): 将麦克风、摄像头等原始输入源封装成独立模块,其唯一职责是采集数据并抛到数据总线上。


事件总线 (Event Bus): 系统的中枢神经。所有「感知器」向总线发布带时间戳的原始数据包,实现模块间通信。


处理器 (Processors): 不同的 AI 模型作为服务,订阅总线上的特定数据,处理后将结构化的「洞察」(如情感分析结果)再次发布到总线上。


架构优势: 极度的解耦和可扩展性。可随时增换「感知器」或「处理器」,无需改动系统其他部分,极大增强系统吞吐能力和鲁棒性。


第二阶段:生成式自我 (The Generative Self) - 让她拥有独一无二的「人格」


目标: 将贝拉的「人格」与「行为」分离,使其「思考」过程成为一个可插拔、可迭代的核心。


能力:

动态人格模型: 由大型语言模型(LLM)驱动,告别固定脚本。她的性格、记忆、幽默感都将是与用户互动后动态生成的。

AI 驱动的化身与梦境: 3D 形象和背景视频能根据她的「心情」或对话内容,通过生成式 AI 实时变化,反映她的「思绪」。


架构师思路:

建立「状态 - 情境 - 人格」引擎 (State-Context-Persona Engine):


状态管理器 (State Manager): 贝拉的「记忆中枢」,订阅所有 AI「洞察」,维护短期和长期记忆。


情境生成器 (Context Generator): 在贝拉需要响应时,从「状态管理器」提取关键信息,组合成丰富的「情境对象」作为 LLM 的输入。


人格 API (Persona API): 将 LLM 封装在内部 API 后,系统其他部分只调用 bella.think (context),实现底层模型的轻松替换和 A/B 测试。


设计「生成式行为总线」 (Generative Action Bus):


「人格 API」的输出是结构化的「行为意图」对象(如 {action: 'speak', content: '...', emotion: 'empathy'}),并发布到专用的行为总线。


贝拉的 3D 化身、声音合成器等所有「表现层」模块,订阅此总线并执行各自的渲染和表现。


架构优势: 人格的可塑性与表现和思想的分离。可以独立升级 LLM 或 3D 模型,而不互相影响,实现真正的模块化。


第三阶段:主动式陪伴 (The Proactive Companion) - 从被动响应到主动关怀


目标是建立一个从被动响应到主动预测的闭环反馈系统,支持持续学习和自我进化。


能力:

意图预测与主动交互: 学习你的习惯和模式,预测你可能的需求,在你开口之前主动提供支持。

自我进化与成长: 核心 AI 模型将持续学习和微调,形成长久的记忆,不断 “成长” 为一个更懂你的伴侣。


架构师思路:

引入「模式识别与预测服务」 (Pattern & Prediction Service):


一个独立的、长周期运行的服务,持续分析长期记忆数据,用更轻量的机器学习模型发现用户习惯,并将「预判」结果发回事件总线。


构建「决策与反馈循环」(Decision & Feedback Loop):


决策 (Decision): 贝拉的「人格 API」接收到「预判」后,结合当前情境,决策是否发起主动交互,这是她「自由意志」的体现。


反馈 (Feedback): 用户的反应(接受或拒绝)被记录下来,作为重要的反馈数据。


进化 (Evolution): 这些反馈数据被用于对「人格 API」的 LLM 进行微调,并优化「模式识别服务」的准确性。


架构优势: 实现真正的「成长」。这个闭环让贝拉不再是一个静态的程序,而是一个能够通过与用户的互动,不断优化自身行为、变得越来越「懂你」的生命体。


而据 Jackywine 说,接下来将会给「Bella」 加上: 语音识别(基础)、 LLM(基础)、 手势识别(进阶)、好感度系统(进阶)、 背景识别与更换,以及移动端……


参考链接:

https://x.com/Jackywine/status/1945452856192213324

https://github.com/Jackywine/Bella


© THE END 

转载请联系本公众号获得授权

投稿或寻求报道:liyazhou@jiqizhixin.com


文章原文

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

Grok AI数字伴侣 Bella开源项目 AI原生开发 数字生命
相关文章