36氪 - AI相关文章 07月28日 11:10
携全双工语音通话大模型亮相WAIC 2025 ,Soul App重新定义AI社交边界
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

Soul App在2025世界人工智能大会上展示了其在AI社交领域的最新进展,特别是自研的端到端全双工语音通话大模型。该模型打破了传统语音交互的局限,赋予AI自主掌握对话节奏的能力,旨在实现更具“温度”和“自主性”的人机交互。Soul App通过AI在社交中扮演情感疗愈伙伴和真人关系桥梁的双重角色,提供深度沉浸的社交体验。同时,Soul也在探索多模态交互,结合全双工语音和实时视频生成,丰富用户的数字人格塑造。Soul致力于构建AI与人类共存的社区,以AI重塑内容和交互方式,降低表达门槛,为用户带来更智能、真实的情感支持和共鸣,重新定义AI社交范式。

AI赋能的“有温度”人机交互:Soul App通过自研端到端全双工语音通话大模型,摆脱了传统语音交互的VAD机制和延迟控制,赋予AI自主决策对话节奏的能力,实现真正双向的“社交”和“情感共生”,而非工具式的轮次对话。这使得AI在交互中能够“读”懂情绪,说“人话”,提供更自然、沉浸的社交体验。

AI在社交中的双重角色:Soul App的AI解决方案让AI在真实社交中扮演“Companion”(情感疗愈伙伴)和“Connector”(真人关系桥梁)的双重角色。作为情感伙伴,AI能动态解析用户困境并提供个性化情绪赋能;作为关系桥梁,AI Agent能捕捉真人用户间的共鸣信号,催化真实友谊的产生。

多模态交互与数字人格塑造:Soul App正积极探索多模态交互,基于全双工语音通话能力和实时视频生成能力,让用户能够看到AI的形象和世界,更立体地塑造“数字人格”。这一研究成果已被国际学术顶会CVPR2025接收,预示着AI社交将向更丰富的维度发展,促进更深层次的关系链接。

AI重构内容与交互,降低表达门槛:Soul App利用AI技术,如灵犀引擎、AIGC技术研发,以及多模态端到端大模型,重构社交内容和交互方式。通过智能推荐主题、辅助内容生成,以及打造“虚拟达人”AI Agent生态,Soul旨在弥合表达鸿沟,让用户自在表达,并在数字世界中获得即时情感支持和共鸣。

AI社交的未来愿景与市场机遇:Soul App将AI的应用方向定位于“AI帮助用户交朋友”(AI辅助社交)和“AI与用户交朋友”(人机互动)。通过虚拟人与真人社交的深度融合,平台期望推动社交向“情感共生”进化,助力构建新世代的数字身份认同体系,并催生“情价比消费”等新的市场机会,重塑社交产品范式和商业化模式。

当AI能够在交互中自主掌握互动节奏,“读”懂情绪,说得“人话”,人机互动体验会有怎样颠覆式的改变?在2025世界人工智能大会暨人工智能全球治理高级别会议(WAIC 2025)展览现场,社交平台Soul App呈现了技术能力建设和应用落地中AI社交的创新解决方案。

7月26日,WAIC 2025在上海隆重开幕。作为全球人工智能领域的顶级盛会,本届WAIC展览聚焦底层能力的演进与具体垂类场景的融合落地。坚持“模应一体”方向、立足“AI+社交”的具体场景,Soul App此次携最新升级的自研端到端全双工语音通话大模型亮相,展出该能力在多人语音互动场景群聊派对AI主持的应用交互效果,并立体呈现AI社区构建成果,展现AI重塑内容和交互后,更智能、真实、沉浸的情感支持和共鸣感受,重新定义AI社交范式。

Soul App CTO陶明表示,“在新质生产力深刻影响人类生活的当下,AI融入社交关系网络、重构交互方式已成为大势所趋。Soul致力于构建AI Being与Human Being共存的社交社区,以AI赋能链接、构建场景、提升体验,为用户带来幸福感和归属感。”

01. 全双工音视频通话能力探索,实现真正“有温度”的人机交互

2025年,当技术积累逐渐成熟,“AI应用爆发”成为共识。在人工智能席卷各行业过程中,一个核心关注点在于,“AI+”为每个个体带来的具体价值是什么?

作为AI社交前沿探索者的代表,Soul在WAIC 2025展览中呈现了自身的思考,其展出的最新社交解决方案,也呈现了AI重塑社交的新方向。

在WAIC 2025现场,以“Soul的AI社交练习”为主题,平台重点展示全双工语音/视频通话能力支持下,“超类真人”和“深度沉浸”的社交体验,让AI在真实社交中扮演双重角色:贴心的Companion(情感疗愈伙伴),动态解析用户社交困境,提供个性化情绪赋能;高效的Connector(真人关系桥梁),AI Agent在真人用户间捕捉共鸣信号,催化真实友谊的萌芽。

此次,也是Soul自研的端到端全双工语音通话大模型正式亮相。不久前,Soul全双工语音通话大模型全面升级,重新定义“全双工”交互范式,摒弃了传统语音交互中依赖的 VAD(话音活性检测)机制与延迟控制逻辑,打破行业中普遍存在的“轮次对话”模式,赋予 AI 自主决策对话节奏的能力。

社交是情绪价值和信息价值的双向流动,让AI在交互中拥有“自主性”和“温度”,这将意味着人与AI之间能够实现真正双向的“社交”和“情感共生”,而非过去工具式的“轮次对话”,创新交互模式也吸引了现场众多观众的驻足体验。

据了解,全双工通话大模型即将在Soul平台内测,后续将陆续落地于虚拟人实时通话、AI匹配等1V1、多对多互动场景。在WAIC现场,观众可以在数字装置上,率先体验到这一能力在Soul平台群聊派对AI主持的应用效果。

具体操作上,当用户进入多人语音互动场景中,AI主持人不仅具备全面管理群聊派对秩序的类真人主持的操作能力,还能够自然进行语音互动,有效活跃气氛、鼓励用户参与对话讨论,帮助用户流畅融入场景,显著提升群聊派对的参与度和体验感。

陶明介绍道,将全双工语音能力应用于多人互动场景,是加速AI融入社交关系网络、赋能真实社交、促进多元体验的关键一步。

值得注意的是,用户天然向往类现实“面对面”的交互感受,因此在赋予AI“自主性”外,多模态交互也是Soul探索的重要方向之一。此次活动现场,Soul也展示了关于全双工实时视频通话能力的最新探索成果,即基于全双工语音通话能力和实时视频生成能力,使用户可以看到“AI的形象和世界”,更多维、立体地塑造“数字人格”,促进关系的深度链接。此前,Soul团队实时人像视频生成研究成果已被国际学术顶会CVPR2025接收。

02. 重构内容和交互方式,以AI打造年轻人的兴趣游乐园

较早将AI引入社交链接,Soul在构建社交社区的过程中,也在持续思考如何以新技术重构内容和交互方式,以AI弥合表达鸿沟,让更多用户更好地表达、即时性交流和互动。因此,在WAIC 2025现场也可以看到Soul 拥抱AI的发展路线,以及当下打造AI社区的最新应用成果展示。

上线于2016年,Soul在发展中积极以AI重塑关系的发现、建立、沉淀环节,帮助用户在无压力的社交环境中自在表达,基于兴趣构建多元社交关系网络,例如推出了灵犀引擎,即目前关系模型的基础。

2020年,Soul启动系统的AIGC技术研发工作,并在智能对话、语音、3D虚拟人等方面拥有前沿积累。自2023年推出自研的Soul X后,Soul还陆续上线了语音生成大模型、语音通话大模型、音乐生成大模型等大模型能力。2024年,Soul AI大模型能力已整体升级为多模态端到端大模型,支持文字对话、语音通话、多语种、多模态理解、真实拟人等特性。

强调自研能力建设、独家的公域社交数据、高效落地应用并迭代,这成为Soul在AI时代快速发展的核心壁垒。

作为社交平台,Soul 有天然的社交和社区属性和优势,能不断更新“原生情绪价值大模型”,精准捕捉用户情感需求(如孤独感、安全感),通过AI向用户提供更长期的情绪价值。

而与用户坚定站在一起、保持对社交市场的深刻洞察,也让Soul快速明确了技术的落地方向,例如,平台“广场”上有高达18% 的新发帖直接反映了用户的真实社交困境(如人际关系处理、社交开启话题、职场交友等),而用户分享的生活、情感内容及其引发的深度共鸣,构成了宝贵的“社交样本库”。

为此,Soul 正在深化 AI 与社区的融合,根据用户兴趣和历史数据,智能推荐主题并辅助生成内容,降低表达门槛,实现个性化发布;以及打造由“虚拟达人”组成的 AI Agent 生态,以细腻、温暖的互动提供即时情感支持和共鸣,构建数字世界社交情感的“附近”。

概括来说,以“AI帮助用户交朋友”(AI辅助社交)和“AI与用户交朋友”(人机互动)为主要应用方向,通过“可共创、可互动”的虚拟人与真人社交的深度融合,平台希望推动社交向“情感共生”进化,助力构建新世代的数字身份认同体系。

陶明表示,当AI真正融入个体的关系网络,带来情绪共鸣和情感支持,这也意味着以AI为代表的新质生产力深入陪伴、社交、数字生活、消费等具体场景,进一步扩展新质消费的范围,将延展出“情价比消费”等全新的市场机会,推动社交行业新的产品范式、商业化模式诞生。

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

AI社交 Soul App 人机交互 全双工语音 情感连接
相关文章