掘金 人工智能 前天 13:36
DeepSeek开源 vs 文心4.5开源
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

本文对比了DeepSeek和百度文心4.5两大开源大模型在模型数量、协议、部署友好度等方面的差异,并探讨了开源模型在社区驱动、数据透明与安全可控、生态扩张吸引资本这三大因素驱动下的发展趋势。文章指出,虽然文心4.5的开源在企业级和开源理念上可能带来影响,但DeepSeek在技术能力上仍具优势。同时,中国在开源社区的活跃度和参与度方面表现突出,开源模型对于保护用户隐私和推动AI生态发展至关重要。

📊 **模型数量与协议差异**:DeepSeek提供了6款开源模型,而百度文心4.5则全面开源了从0.3B到424B共10款模型。在开源协议上,DeepSeek采用更宽松的MIT协议,而文心4.5使用Apache 2.0协议,后者对企业用户而言在专利使用权方面提供了更明确的保障。

🚀 **部署友好度与社区/工业级定位**:DeepSeek在部署上更侧重于社区开发者,但企业级部署也十分广泛,常被称为“满血版”。百度文心则更偏向于工业级的部署需求,体现了不同的市场定位和用户群体。

💡 **开源驱动因素分析**:大模型普遍走向开源主要有三大驱动力:一是**社区驱动**,通过开源加速创新、修复和优化,吸引用户和投资者,推动生态发展;二是**数据透明与安全可控**,开源能解决用户对数据隐私泄露的担忧,尤其对企业而言,自主可控的模型是刚需;三是**生态扩张吸引资本**,通过开源吸引大量开发者部署和微调,形成强大的生态粘性,进而吸引资本投资,实现价值增长。

🇨🇳 **中国在开源领域的表现**:中国在开源领域拥有深厚的土壤和活跃的开发者群体,在开源排行榜中占据重要位置。中国开发者在全球开源项目中的参与度非常高,这预示着中国在AI开源浪潮中有望脱颖而出。

⚠️ **实际应用中的挑战**:尽管文心官方公布的数据表现良好,但在实际使用中仍可能遇到如基础数学问题(如3+4等于几)或数值比较(如4.19与4.2哪个更大)等方面的测试问题,这提示了在大模型实际应用中对模型鲁棒性和准确性的持续关注和优化是必要的。

开源模型数量: DeepSeek开源主模型+多个蒸馏版本共6款,文心4.5全面开源从 0.3B 到 424B共10款模型。

开源协议: DeepSeek是开源MIT协议,而百度文心4.5开源在Apache 2.0协议。MIT 更加宽松,Apache 2.0 更规范。MIT是开发者的最爱,Apache是企业法务的刚需。因为Apache 2.0明确授予用户对代码中涉及的专利具有使用权。

部署友好度: 部署这方面DeepSeek更偏向于社区开发者,百度文心更偏向于工业级的部署。当然DeepSeek虽然偏向于社区驱动,但事实上很多企业级也是部署deepseek,也就是我们常看到的满血版DeepSeek。

如果说这次文心的开源对国内大模型,在技术方面会带来非常大的影响,肯定还是不现实的,毕竟DeepSeek的能力摆在那的。或许更多的影响是在企业级、开源理念方面的影响。

虽然文心官方给出来的数据还是比较好的,但使用后还是能测试出很多问题。比如:

大模型普遍走向开源的三大驱动因素

社区驱动、加速创新

开源可以激发全球研发者协同迭代,快速修复与优化模型。是吸引用户提高知名度较快的手段之一。只要用户起来了,生态起来了就会有投资者投入资金。

在中国并不缺乏开源的土壤的,开源排行榜top10里就是3个中国项目在里面,中国不缺乏开源精神的种子,所以在开源AI浪潮中中国出线也并不奇怪。

打开User这个维度的排行榜,可以看到中国人(含华人)占比24% ,在全球占比非常的高。

中国的开源开发者还非常的活跃,另外国人对开源的关注性一直都很高。

数据透明与安全可控

对于AI平台来说最核心的就是算力、算法、数据。

目前互联网能获取的数据基本上都差不多了,现在就是通过用户使用AI来获取用户的数据,说直白点说是要给AI投喂数据。但站在用户这个角度来说,我的数据投喂给了AI那我的秘密、隐私都泄露了。

对于个人用户、企业用户都是一样的,需要使用AI,但又担心隐私的泄露。特别是企业的业务数据,很多都是公司赢利的关键不能被泄露。所以企业更迫切需要搭建属于自己的AI大模型。如果AI是个闭源的,黑盒程序信息泄露的担心会更加强烈。而如果它开源了,那就完全没有这个担心了。

生态扩张,吸引资本

目前互联网很多企业本身是不赚钱的,比如openai一直说自己每年亏很多钱,但还是非常积极的开着公司,不会倒闭。因为他们本身就不是靠卖API来赚钱的,靠的是吸引资本的投资,让他们的身价上升、股票升值。

再如Hugging Face虽然以开源工具起家,但融资估值已达45亿美元。

而模型一旦开源就会被大量的开发者部署、微调,这样就会快速形成粘性很强的生态,不少开发者不但是用户,还是测试者、开发者。

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

大模型 开源 DeepSeek 文心4.5 AI生态
相关文章