赛博禅心 01月30日
DeepSeek 再度开源:用 Janus-Pro 撕开算力铁幕
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

DeepSeek开源了多模态模型Janus-Pro,该模型具备视觉理解和图像生成双重能力。Janus-Pro不仅能进行图像识别、地标识别和文字识别,还能生成图片,这得益于其解耦视觉编码技术。在理解通路,它能准确感知图片信息;在生成通路,它能像艺术家一样描绘图像。DeepSeek通过优化训练策略、使用海量训练数据和扩大模型规模,使Janus-Pro的性能大幅提升。与OpenAI的DALL-E相比,Janus-Pro在参数上领先,且功能更全面,标志着中国在AI领域取得了重要进展。

🖼️ Janus-Pro是DeepSeek开源的多模态模型,具备图像理解和生成双重能力,可同时面向过去与未来。

👁️‍🗨️ 该模型采用解耦视觉编码技术,既能迅速感知图像信息,又能像艺术家一样进行图像创作,不只是简单的“看”,而是“看”和“画”结合。

🚀 Janus-Pro的性能提升得益于更优化的训练策略、前代模型三倍以上的海量训练数据以及更大规模的模型,参数量达到70亿。

🌍 与OpenAI的DALL-E相比,Janus-Pro在参数上领先,且具备图像识别、地标识别、文字识别等多种能力,功能更为全面。

原创 金色传说大聪明 2025-01-28 04:03 广东

这场 AI 世界大战,终于轮到中国玩家来定义语法。东方破晓,愿君行早

今天是除夕,凌晨 1 点,我在北京的公寓里写算法。白天在中关村咖啡馆的喧嚣, AppStore 登顶的狂欢, 仿佛已经是上个世纪的事情。 

DeepSeek 完全指南:这到底是怎样的存在?

 

此刻的屏幕上,不断翻出来新的消息:DeepSeek Janus-Pro 开源

让我们一起,来看看这旧年的最后一个惊喜 


 

这是一个多模态模型,名称来源于古罗马神话中的双面神“雅努斯”(Janus):它同时面向过去与未来。当然,你也可以说,这代表了模型的两种能力——既要进行视觉理解,又要进行图像生成。 

 

发布的地址在这: 

https://github.com/deepseek-ai/Janus 

https://huggingface.co/deepseek-ai/Janus-Pro-1B 

https://huggingface.co/deepseek-ai/Janus-Pro-7B 

 


 

同时发布的,还有一份技术文档,可以回复 Janus 获取这份文档。 

 

首先,我得承认,我对图像处理这块并不精通,所以如果有解读错误的地方,欢迎评论区指正。 

 

官方给了一些生成的效果图,明显强于 Janus 原版。虽比不上 Midjourney 那般艺术,但应为第一梯队。 

 

如果是对比 OpenAI 的 DALL-E 3,参数会领先不少,并且直接霸榜。 

 

更不同于 OpenAI 的 DALL-E 只能画图,Janus 同时包含了多种能力:比如图像识别、地标识别、文字识别等。 

 

图像识别能力,也就是所谓的读图 

 

地标识别能力,比如让他猜这张图片是在哪拍的 

 

图片通识 - 他知道很多的文化符号,比如 Tom and Jerry 

 

来识别图片中的文字 

 

当然,自然也能生成图片 

 

 

你会发现,这个模型不同于 4o 类型的模型 - 只能看,而是既能看,也能画。其原因,便是 Deep Seek 的这个模型,使用了解耦视觉编码技术 

在“理解通路”,它能迅速感知到图片的核心信息,并给出更准确、更专业的回答; 

而在“生成通路”上,它便是一个艺术家,像 MidJourney 一样,去描绘笔触和色彩。 

 

 

至于这个模型是如何做到这些的,按报告说法,基于以下三条: 

 

如果对详细信息感兴趣,可以回复 Janus 获取这份文档。 

 


 

再度看向屏幕,已是刚过四点:不久,就要天亮了

 

 

在我们的土地上,正传颂着一种新的叙事:不搞算力禁运,不搞实体清单,不用算力砌高墙,而以开源筑长阶,邀世界共赴星辰。 

 

东方破晓,愿君行早。 

 


阅读原文

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

DeepSeek Janus-Pro 多模态模型 开源 AI
相关文章