科大讯飞在 1024 发布会上带来了星火大模型的全新升级,将基础能力和应用落地推向新的高度。星火大模型升级至 4.0 Turbo,并发布 10 项基于其底座能力的产品与创新应用。此次升级主要体现在数字人交互的革新、AI 搜索功能的增强、模型能力的提升以及多语言支持的拓展等方面,展现了科大讯飞在大模型应用场景化方面的探索与突破。
🚀 **数字人交互升级:小星畅聊,更具情感的 AI 交互**
讯飞推出「小星畅聊」解决方案,将 AI 视频通话、虚拟人交互和多模态交互融为一体,让 AI 更加人性化。小星畅聊能够根据语音节奏和语义自动生成表情与动作,支持音视频输入,实现文本、语音和表情的跨模态语义一致性。无论是科普面霜,推荐酒水礼物,还是看图讲故事,小星都能流畅地完成任务,甚至带动销售。小星还能够整合画面中的跨语言信息进行精准回复,展现出其强大的多语言理解能力。
🔍 **AI 搜索升级:星火 AI 搜索,提供更加全面且个性化的答案**
星火 AI 搜索基于星火大模型的强大能力,从文本交互扩展到语音交互和音视频流交互。它整合了 45 个在线资料,能够针对性地回答用户的问题,并进行衍生拓展,提供更加全面且个性化的答案。星火 AI 搜索已全面上线 APP、Web 和 PC 端,还提供了热点新闻版块,帮助用户及时掌握最新信息。
🔥 **模型能力提升:讯飞星火 4.0 Turbo,超越 GPT-4o**
讯飞星火 4.0 Turbo 在数学能力和代码能力方面超越了 GPT-4o,在 14 项主流测试集中取得了优异成绩,在 9 项测试中成功超越 GPT-4o。该版本已完成超长思维链、树搜索以及自我反思评价等算法的验证,预计在年底实现类 OpenAI o1 的高难度数学能力。在代码能力方面,讯飞星火 4.0 Turbo 在 Python、Java、JavaScript 等任务上与 GPT-4o 差距甚微,在 C++ 能力方面甚至超过了 GPT-4o。
🌐 **多语言支持拓展:首次发布多语言大模型,覆盖多国语言和 202 个方言**
科大讯飞首次发布了多语言认知大模型,覆盖英语、俄语、日语、汉语、法语、西语、葡语、德语等多种语言。该模型在汽车、家电、办公、翻译等行业的任务场景中,效果超越了 GPT-4o。语音识别首次实现全国地级市方言全覆盖,覆盖了 288 个地市的 202 种方言。
💰 **API 降价:使用大模型成本降低,助力开发者创新**
面向开发者,讯飞星火 API 矩阵进一步扩大,使用大模型的成本进一步降低,主力版本每 1M Tokens 低至 5 元。同时,讯飞还上线了 70B 新版本 (V4.5)、评语大模型、日语大模型、可定制 API、知识增强 API 等产品,为开发者提供更多选择和支持。
今年的 1024,上午 10 时。
科大讯飞带着星火的全新升级登场了。
讯飞星火大模型升级到了 4.0 Turbo,同时还首发了 10 项基于讯飞星火底座能力的产品与创新应用。亮点一:AI 变得更具情感,数字人有了更进一步的应用
数字人方向,讯飞提出了新的解决方案,「小星畅聊」。
小星畅聊把 AI 视频通话+虚拟人交互+多模态交互融为一体,让 AI 变得更具人类情感了。
在科大讯飞研究院院长刘聪的演示中,它具备根据语音节奏以及语义自动生成表情与动作的能力,同时支持音视频输入,成功实现了文本、语音和表情的跨模态语义一致性。
不管是科普面霜,推荐酒水礼物,亦或者是看图讲故事,都很顺利的完成了,甚至带起了货。
当摄像头转向印有外文的化妆品及酒类产品时,小星还能整合画面中跨语言的产品品牌、功能等信息进行精准回复。说完了数字人,就不得不提到第二个亮点功能是「星火 AI 搜索」。数字人的基座能力就建立在星火的 AI 搜索功能之上,从文本交互到语音交互再拓展到音视频流所完成的实时多模交互。
先来体验一下深度搜索,让星火给我答疑解惑。

可以看到,讯飞的 AI 搜索整合了 45 个在线资料,会先针对性的回复我的关键疑问,后续在进行衍生拓展,连最新的「停播和复播」事件都有提到。

星火 AI 搜索已全面上线 APP、Web 以及 PC 端。首页还有热点新闻版块,能够帮助用户时刻掌握最新信息、资讯。总结来说,星火的 AI 搜索,能对更多网页进行搜索,提供更加全面且个性化的答案。最后我们来聊聊新模型升级版「讯飞星火 4.0 Turbo」。
在数学能力以及代码能力方面,讯飞星火 4.0 Turbo 已然超越了 GPT - 4o。这一结论是由艾伦人工智能研究所、OpenAI 等国内外极具权威性的单位发布的。在涵盖了理解和推理、综合考试、数学和科学、代码等多种不同任务类型的 14 项主流测试集中,讯飞星火 4.0 Turbo 表现出色,在其中 9 项测试集中成功实现超越,其效率相对提升了 50%。今年的发布会上,科大讯飞董事长刘庆峰着重强调了数学能力与代码能力。就数学能力而言,依据实用数学任务构建的测试集 CAppliedMath - 1.0 进行测试,讯飞星火 4.0 Turbo 在计算、财务、金融、度量等多个维度的任务表现中,均超越了 GPT - 4o 的水平。
同时,刘庆峰也透露,4.0 Turbo 版本已成功完成超长思维链、树搜索以及自我反思评价等算法的验证。预计在今年年底能够实现类 OpenAI o1 的高难度数学能力。

而在代码能力方面,通过代码生成 HumanEval 测试集上的效果对比发现,讯飞星火 4.0 Turbo 在 Python、Java、JavaScript 等任务上与 GPT - 4o 的差距甚微,在 C++ 能力方面更是超过了 GPT - 4o。与此同时,他们还推出代码 7B 版本,支持代码生成、代码补全等任务。
亮点四:首次发布多语言大模型,覆盖多国语言和 202 个方言
本次发布会还首发了多语言认知大模型,覆盖包括英语、俄语、日语、汉语、法语、西语、葡语、德语等多种语言。在汽车、家电、办公、翻译等行业的任务场景中,多语言大模型效果超过了 GPT-4o。语音识别首次实现全国地级市方言全覆盖,覆盖了 288 个地市的 202 种方言。
面向开发者,讯飞星火 API 矩阵进一步扩大,让使用大模型的成本进一步降低,主力版本每 1M Tokens 低至 5 元。

同时将新上线70B新版本(V4.5)、评语大模型、日语大模型、可定制API、知识增强API等产品。

星火杯作为唯一团中央点名支持的大模型应用大赛,有来自全球 533 所高校的 1656 支大学生开发者团队共同参赛。其中,Top 20 里有 8 支队伍来自 Datawhale。
整场发布会,让我们看到了讯飞的思考。
今天,AI 应用正进入到场景化的深水区。
诚然,国内先好好追追多模态和 Dalle 3 比较务实。
但是不可否认的是,大模型也正迎来规模化应用的时代。
教育、医疗,讯飞无不在这些民生之本上下功夫,确实是看到了中国人工智能国家队的社会责任感。
今年讯飞的关键词,也是想给大家传递的:顶天立地、自主可控、通专结合、端云联动、软硬一体。
深深看出科大讯飞成立25年来的初心、匠心、开放和创新。
解放生产力、释放想象力,不再是梦。
一起“点赞”三连↓