2025-01-24 13:18 湖北
刚刚,百川智能体发布了国内首个全场景深度思考模型Baichuan-M1-preview,并开源了行业首个开源医疗增强大模型Baichuan-M1-14B。
国产o1-like大模型最近接连发布(kimi 1.5,DeepSeek R1),提前过年
Baichuan-M1-preview是国内目前唯一同时具备语言、视觉和搜索三大领域推理能力的模型,效果超越o1-preview。
Baichuan-14B-M1 则是Baichuan-M1-preview的小尺寸版本也是业界首款从零开始专为医疗场景优化的开源大语言模型。在拥有卓越通用能力的同时,在医疗领域方面有着强大的性能。在大部分通用榜单评测中达到了同尺寸模型的效果,而在医疗场景中达到了5倍甚至更大的模型的效果。
Baichuan-14B-M1模型的核心特点:
从零开始基于 20万亿 token 的高质量医疗与通用数据训练。
针对 20+ 医疗科室 细粒度医疗专业建模。
引入 创新模型结构,显著提升上下文理解和长序列任务表现。
提供 Base 模型 和 Instruct 模型。
通过强化学习和偏序对数据的优化,提升模型生成质量、逻辑推理能力和用户偏好贴合度,这种多阶段与对齐优化相结合的方法,使模型在通用能力和医疗领域能力上均达到了卓越的水平。
https://github.com/baichuan-inc/Baichuan-M1-14B
推荐阅读
• 对齐LLM偏好的直接偏好优化方法:DPO、IPO、KTO
• 追平满血版o1,多模态思考模型Kimi 1.5带来多项技术创新
• RAG全景图:从RAG启蒙到高级RAG之36技,再到终章Agentic RAG!
• Agent到多模态Agent再到多模态Multi-Agents系统的发展与案例讲解(1.2万字,20+文献,27张图)
欢迎关注我的公众号“PaperAgent”,每天一篇大模型(LLM)文章来锻炼我们的思维,简单的例子,不简单的方法,提升自己。