PaperAgent 2024年12月14日
以小博大,微软Phi-4正式发布~
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

微软发布了14B参数的语言模型Phi-4,其核心在于数据质量的提升。通过合成数据预训练和中期训练,以及对有机数据的精心策展和过滤,Phi-4在推理基准测试上表现出色。模型训练的关键包括多样性、细微差别和复杂性、准确性以及思维链等原则。合成数据涵盖50种不同类型,累积约4000亿token。后训练阶段,通过SFT和DPO技术,进一步提升了模型性能。Phi-4的发布再次印证了数据在AI模型发展中的重要性。

💡 Phi-4的核心是数据质量,通过合成数据预训练和中期训练,提升模型推理和问题解决能力。

🔍 数据处理方法包括合成数据生成(多样性、细微差别、准确性、思维链),以及有机数据的策展和过滤(优先选择推理密集型材料)。

🚀 后训练阶段采用SFT和DPO技术,并使用关键令牌搜索(PTS)技术生成DPO数据,提升模型性能。

2024-12-13 21:09 湖北

OpenAI近期年底大戏持续放出各种技能,微软也坐不住了,正式发布了Phi-4,一个拥有14B参数的语言模型,并发布了技术报告,其训练方法的核心重点是数据质量。

尽管与phi-3架构相比变化极小,但由于数据的改进、训练课程的优化以及后训练方案的创新,phi-4相对于其规模实现了强大的性能——特别是在以推理为重点的基准测试上。

    phi-4的核心支柱

数据方法:详细介绍了合成数据的目的和生成方法,包括种子策展、重写和增强、自我修订、指令反转以及代码和其他科学数据的验证。

预训练细节:描述了phi-4模型的架构和预训练过程,包括数据组成和中期训练的细节。

后训练:介绍了如何通过SFT和DPO将预训练模型转化为用户可以安全交互的AI助手,包括关键令牌搜索(PTS)技术来生成DPO数据。

phi-4数据处理方法

    合成数据生成的原则

预训练和中期训练的合成数据

有机数据的策展和过滤

后训练数据集

https://arxiv.org/pdf/2412.08905

推荐阅读


欢迎关注我的公众号“PaperAgent”,每天一篇大模型(LLM)文章来锻炼我们的思维,简单的例子,不简单的方法,提升自己。

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

Phi-4 语言模型 数据质量 合成数据 DPO
相关文章