讯飞官方宣布,其讯飞星火医疗大模型在MedBench最新榜单上以综合得分95.4的成绩位列榜首。该模型在复杂医学推理、医学语言理解、医疗安全和伦理等核心能力方面均表现出色。MedBench是上海人工智能实验室联合多家机构打造的中文医疗大模型权威评测体系,涵盖医学语言理解、生成、知识问答、推理、安全伦理等多个维度。讯飞星火医疗大模型作为国内唯一基于全国产算力训练的医疗大模型,已在全国31个省市的基层医疗机构广泛应用,服务超22万名基层医生,并与超500家等级医院深度合作,提供创新的智慧服务体系和医疗质量提升方案。
🥇 讯飞星火医疗大模型在MedBench评测中以95.4分综合得分登顶,并在复杂医学推理、医学语言理解、医疗安全和伦理等多项核心能力上均位居第一。
📚 MedBench是由上海人工智能实验室联合多家机构构建的中文医疗大模型权威评测体系,涵盖医学语言理解、生成、知识问答、复杂医学推理、医疗安全和伦理五大维度,为中文医疗大模型提供全方位评估。
🏥 讯飞星火医疗大模型是国内唯一基于全国产算力训练的医疗大模型,已在全国31个省市的692个区县、超7.4万家基层医疗机构应用,服务超22万名基层医生,显著提升基层医生工作效率与服务质量。
🤝 讯飞医疗与超500家等级医院深度合作,基于讯飞星火医疗大模型,提供以患者管理为核心的创新智慧服务体系和以病历内涵质控为核心的医疗质量提升方案。
IT之家 6 月 17 日消息,讯飞官方今日发文,宣布其讯飞星火医疗大模型在 MedBench 最新榜单上以综合得分 95.4 的成绩登顶。
IT之家注意到,讯飞星火医疗大模型在复杂医学推理、医学语言理解、医疗安全和伦理等多项核心能力方面均位居第一。

讯飞官方介绍称,MedBench 是上海人工智能实验室联合多家机构打造的中文医疗大模型权威评测体系与平台,融合了海量医学知识和医疗机构医学专家的丰富经验,构建了覆盖医学语言理解、医学语言生成、医学知识问答、复杂医学推理、医疗安全和伦理五大维度的科学评估体系,涵盖医学考试、医学问答、患者服务、医疗咨询、病例分析以及病历生成等多个医学任务,基于医学权威标准,为中文医疗大模型在各个医学维度的能力提供了全方位多维度的评估与量化。
据介绍,作为国内唯一基于全国产算力训练的医疗大模型,讯飞医疗 AI 诊疗助理已在全国 31 个省市的 692 个区县、超 7.4 万家基层医疗机构应用,服务超 22 万名基层医生,显著提升基层医生工作效率与服务质量。
讯飞医疗表示,他们已经与超 500 家等级医院深度合作,以讯飞星火医疗大模型为底座,提供以患者管理为核心的创新智慧服务体系和以病历内涵质控为核心的医疗质量提升方案。