商汤科技宣布其“日日新融合大模型交互版”(SenseNova-5o)正式对外提供限时免费的实时音视频对话服务。该模型具备实时交互、视觉识别、记忆思考、持续对话和复杂推理等能力,旨在实现AI与人类更自然流畅的交流。通过配套的Realtime API服务优化,模型与RTC网络结合,确保用户在任何环境下都能体验稳定、实时、流畅且无延迟的音视频对话。该模型还支持超长多模态交互记忆,能持续跟踪和积累用户交互信息,并根据用户偏好进行个性化设置。
🗣️SenseNova-5o支持实时音视频对话,具备实时交互、视觉识别、记忆思考、持续对话和复杂推理等能力,旨在提升AI与人类交流的自然度和流畅度。
⏱️该模型具备超长多模态交互记忆,能够持续跟踪和积累与用户的交互信息,不断优化对用户需求的理解,并能将交互延迟缩短至2秒以内,接近人类自然交流水平。
⚙️SenseNova-5o支持根据用户偏好进行个性化设置,例如交流风格和使用习惯(人设、语气等),并支持随时打断、持续对话和根据上下文引导新话题,进一步增强用户体验。
👨🏫该模型还具备帮助家长辅导孩子作业的能力,这表明其在教育领域的潜在应用价值。
IT之家 1 月 20 日消息,北京市商汤科技开发有限公司今日发文宣布,旗下「日日新融合大模型交互版」(SenseNova-5o)正式对外提供实时音视频对话服务,限时免费使用。

据介绍,该模型是商汤“日日新”融合大模型的交互版本,支持实时交互、视觉识别、记忆思考、持续对话和复杂推理等能力,能帮助 AI 与人类更自然、更流畅地交流。
商汤还为「SenseNova-5o」提供配套的 Realtime API 的服务优化,实现与 RTC 网络的结合。官方称用户在任何环境下都能稳定、实时、流畅、无延迟的音视频对话和沟通。
IT之家附商汤科技「日日新融合大模型交互版」亮点信息如下:
支持超长多模态交互记忆不少于 5 分钟
持续跟踪和积累与用户的交互信息,不断完善和优化对用户需求的理解
当前的交互延迟缩短至 2 秒以内,宣称“与人类自然交流几乎无差”
支持随时打断、持续对话、根据上下文引导新话题
支持根据用户偏好,个性化设置交流风格与使用习惯(人设、语气等)
支持帮助家长辅导孩子作业
