AI & Big Data 01月31日
Hugging Face逆向工程DeepSeek-R1,將打造開放推理模型Open-R1
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

中国AI公司DeepSeek-R1模型以低成本展现高推理能力,引发市场震动。Hugging Face正通过逆向工程,试图推出开放版本Open-R1。DeepSeek未公开完整训练数据和代码,Hugging Face希望通过逆向工程和社群协作,构建可验证的语言模型。DeepSeek-R1在数学、编程和科学推理方面表现突出,成本却远低于其他模型。Open-R1旨在提供透明度和研究价值,使研究人员掌握其架构和训练方法,并可供企业改进模型输出。Hugging Face将使用其计算资源,预计在数周内推出首个公开测试版本。

🚀DeepSeek-R1模型以低廉的成本实现了高水平的推理能力,在市场上引起了巨大反响,其在数学、编程和科学领域的推理能力甚至可以与OpenAI o1模型相媲美。

🛠️Hugging Face正通过逆向工程,试图推出名为Open-R1的开放版本,旨在让研究社群在透明、可验证的环境下更深入地了解DeepSeek-R1的技术突破,并建立完整的训练工作管线和数据集。

💡DeepSeek-R1未公开完整的训练数据集和代码,Hugging Face认为只发布模型权重和部分技术报告不足以满足真正的开放标准,因此决定通过大规模协作,构建可供研究者自行验证和调整的语言模型。

🌍Open-R1的推出不仅是对DeepSeek-R1的复刻,更可能在技术透明度和研究价值上超越原始模型,它将允许任何人审查并改进强化学习流程、语言模型结构以及推理逻辑,这对需要确保模型输出精度和可控性的企业至关重要。

💻Open-R1模型的训练将使用Hugging Face的Science Cluster计算资源,该集群拥有768颗Nvidia H100显卡,Hugging Face预计将在数周内推出第一个可公开测试的原型版本。

中國人工智慧公司所開發的DeepSeek-R1模型發布以來,相對低廉的硬體與訓練成本就能展現高水準推理能力,在市場引發極大震盪。Hugging Face現正根據DeepSeek所公布的研究內容進行逆向工程,試圖推出名為Open-R1的開放版本,期望在透明、可驗證的環境下讓研究社群能更深入了解該突破性技術。由於DeepSeek-R1以遠低於市場預期的成本達到與先進模型相近的推理表現,業界與學界都希望能了解技術全貌,但DeepSeek未公開完整的訓練資料集與程式碼,使得外界對其稱為開源模型的真實性存有疑慮。Hugging Face工程師認為,如果只釋出模型權重與部分技術報告,仍不足以滿足真正的開放標準,因而決定透過逆向工程與大規模協作,建置完整可供研究者自行驗證與調整語言模型,成為推理模型的開放訓練工作管線與資料集。深度學習社群之所以對此舉格外關注,主要是因為DeepSeek-R1在數學、程式開發與科學領域的推理能力,甚至能與知名的OpenAI o1模型一較高下,而開發成本卻聲稱僅有美國人工智慧公司花費的一小部分。一旦Hugging Face成功重現Open-R1,研究人員將可確切掌握其中關鍵架構、訓練步驟,以及在有限硬體資源下達到高效訓練的方法。目前Hugging Face團隊的做法,是先分析DeepSeek發布的技術報告與模型論文,並嘗試從現有權重中推斷其訓練配方與資料分布。由於DeepSeek並未開放完整的資料集與程式碼,Hugging Face需要召集志願者,共同整理出可供公開使用的高品質推理資料,藉此復刻或接近DeepSeek-R1所使用的多階段訓練策略。當Open-R1順利出爐,將不只是一個DeepSeek-R1複製品,更可能在技術透明度與研究價值上進一步超越原始模型。Open-R1可供任何人檢閱並改良強化學習流程、語言模型結構以及推理邏輯。這對需要確保模型輸出精度與可控性的企業而言相當重要,也進一步突顯了開源社群在推動人工智慧技術發展時所扮演的關鍵角色。Open-R1模型的訓練將使用Hugging Face的Science Cluster運算資源,該叢集有96個節點,每個節點有8張顯示卡,共768顆Nvidia H100可用於密集訓練,Hugging Face預計在數周內推出第一個可公開測試的原型版本。

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

DeepSeek-R1 Open-R1 逆向工程 Hugging Face 开源模型
相关文章