今年的1024，一些有趣的AI观察

Datawhale报道

洞察：Datawhale in 1024

今年的 1024，上午 10 时。

科大讯飞带着星火的全新升级登场了。

这次星火的升级主要分为基础能力和应用落地。

讯飞星火大模型升级到了 4.0 Turbo，同时还首发了 10 项基于讯飞星火底座能力的产品与创新应用。

我们挑几个最惊艳的点来说。

亮点一：AI 变得更具情感，数字人有了更进一步的应用

数字人方向，讯飞提出了新的解决方案，「小星畅聊」。

小星畅聊把 AI 视频通话+虚拟人交互+多模态交互融为一体，让 AI 变得更具人类情感了。

在科大讯飞研究院院长刘聪的演示中，它具备根据语音节奏以及语义自动生成表情与动作的能力，同时支持音视频输入，成功实现了文本、语音和表情的跨模态语义一致性。

不管是科普面霜，推荐酒水礼物，亦或者是看图讲故事，都很顺利的完成了，甚至带起了货。

当摄像头转向印有外文的化妆品及酒类产品时，小星还能整合画面中跨语言的产品品牌、功能等信息进行精准回复。

亮点二：AI 搜索，提供更加全面且个性化的答案

说完了数字人，就不得不提到第二个亮点功能是「星火 AI 搜索」。

数字人的基座能力就建立在星火的 AI 搜索功能之上，从文本交互到语音交互再拓展到音视频流所完成的实时多模交互。

先来体验一下深度搜索，让星火给我答疑解惑。

可以看到，讯飞的 AI 搜索整合了 45 个在线资料，会先针对性的回复我的关键疑问，后续在进行衍生拓展，连最新的「停播和复播」事件都有提到。

还提供了泉哥的涨粉数据是我没有想到的。

星火 AI 搜索已全面上线 APP、Web 以及 PC 端。首页还有热点新闻版块，能够帮助用户时刻掌握最新信息、资讯。

总结来说，星火的 AI 搜索，能对更多网页进行搜索，提供更加全面且个性化的答案。

亮点三：讯飞星火 4.0 Turbo 上线

最后我们来聊聊新模型升级版「讯飞星火 4.0 Turbo」。

在数学能力以及代码能力方面，讯飞星火 4.0 Turbo 已然超越了 GPT - 4o。

这一结论是由艾伦人工智能研究所、OpenAI 等国内外极具权威性的单位发布的。

在涵盖了理解和推理、综合考试、数学和科学、代码等多种不同任务类型的 14 项主流测试集中，讯飞星火 4.0 Turbo 表现出色，在其中 9 项测试集中成功实现超越，其效率相对提升了 50%。

今年的发布会上，科大讯飞董事长刘庆峰着重强调了数学能力与代码能力。就数学能力而言，依据实用数学任务构建的测试集 CAppliedMath - 1.0 进行测试，讯飞星火 4.0 Turbo 在计算、财务、金融、度量等多个维度的任务表现中，均超越了 GPT - 4o 的水平。

同时，刘庆峰也透露，4.0 Turbo 版本已成功完成超长思维链、树搜索以及自我反思评价等算法的验证。预计在今年年底能够实现类 OpenAI o1 的高难度数学能力。

而在代码能力方面，通过代码生成 HumanEval 测试集上的效果对比发现，讯飞星火 4.0 Turbo 在 Python、Java、JavaScript 等任务上与 GPT - 4o 的差距甚微，在 C++ 能力方面更是超过了 GPT - 4o。与此同时，他们还推出代码 7B 版本，支持代码生成、代码补全等任务。