AI & Big Data 4小时前
6年後 OpenAI再釋出開放權重的語言模型
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

OpenAI在GPT-2发布六年后面向公众推出了两款开放权重的模型gpt-oss-120b和gpt-oss-20b。这两款模型目前仅支持文本处理,但展现出强大的性能和推理能力。gpt-oss-120b是OpenAI最强大的开放模型,适合单H100 GPU平台;gpt-oss-20b则为中等规模模型,适用于低延迟应用。它们以Apache 2.0协议开放,允许自由使用、定制或商业部署。模型具备131,072的上下文窗口,支持函数调用、联网、Python代码执行等高级功能,并在推理和知识方面紧追其旗舰模型,甚至在AIME 2024测试中超越了o3和o4-mini。此举回应了行业对AI普及的呼声,并有助于政府及注重数据安全的组织构建自主AI能力。

🧠 OpenAI发布了GPT-OSS系列的两款开放权重模型:gpt-oss-120b和gpt-oss-20b。gpt-oss-120b是其最强大的开放模型,适用于H100 GPU平台,而gpt-oss-20b则适合低延迟应用。两款模型均采用宽松的Apache 2.0协议,允许用户自由使用、定制或商业部署,旨在加速AI技术的普及和创新。

🚀 在功能方面,GPT-OSS系列模型支持高达131,072的上下文窗口,并具备强大的推理能力。它们支持函数调用、联网、Python代码执行和结构化输出,能够提升除错和输出质量。用户还可以根据应用场景和延迟需求调整模型参数,以优化性能。

💡 OpenAI将GPT-OSS模型与旗艦模型进行了比较,发现gpt-oss-120b在推理、知识和数学能力上紧密追赶,甚至在AIME 2024基准测试中超越了o3和o4-mini,证明了开放模型在性能上的巨大潜力。

🌍 OpenAI计划将GPT-OSS模型整合到其“国家合作计划”中,以支持各国政府(首个为美国)建立AI数据中心,确保数据主权。这使得政府或注重数据安全的组织能够自建模型和AI应用,更好地控制和管理自身数据资产。

在公眾期待下,在GPT-2推出6年後,OpenAI昨(5)日宣布釋出2款開放權重的模型gpt-oss系列,目前僅支援文字,但具備高效能及推理能力。

最新釋出的模型包含gpt-oss-120bgpt-oss-20b。gpt-oss-120b號稱是該公司最強大的開放權重模型,適合單一H100 GPU平臺。gpt-oss-20b則為中等規模的開放模型,適合低延遲性應用。二者都是以寬鬆Apache 2.0授權開放,允許使用者自由開放,適合實驗、客製或商用部署。

功能面而言,目前gpt-oss-120b和gpt-oss-20b都僅支援文字輸出輸入(尚不支援影音)和基礎的回應,但是效能強大:提供131,072 context window,最大輸出131,072 token,也雙雙使用完整思維鏈可提升除錯和輸出品質,並且都具備代理人能力,支援函式呼叫、上網、Python程式碼執行及結構化輸出。此外,兩模型都允許依據應用場景和延遲性需求,調整推理能力強度、或微調參數。

OpenAI也提供二個模型和旗艦模型OpenAI o3和o4-mini的比較。作為免費模型,gpt-oss-120b在推理與知識、數學緊追封閉模型,甚至在標竿測試AIME 2024中還超越o3及o4-mini。

這是繼2019年的GPT-2、2021的CLIP和2022年的Whisper開放計畫之後,再度釋出開放權重的重要模型。今年初中國DeepSeek引發關注,掀起美國業界討論必須以開放模式加速AI普及,使OpenAI備受開放模型的壓力。今年3月執行長Sam Altman承諾會釋出開放權重模型。

透過最新公布,OpenAI說開放模型允許政府或講求資料安全的組織自建模型及AI應用,該公司也計畫把二個模型整合到今年5月宣布的OpenAI for Countries(國家合作計畫),協助各國政府(第一個是美國)打造AI資料中心並確保資料主權。

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

OpenAI GPT-OSS AI模型 开放权重 人工智能
相关文章