热点
关于我们
xx
xx
"
视觉编码
" 相关文章
突破AI视觉“选择性失明”,哈工大首次实现指令驱动的全景式感知
量子位
2025-04-19T06:55:30.000000Z
DeepSeek多模态能力起底!一探究竟Janus 系列模型:解耦统一多模态理解和生成模型的视觉编码
机器学习初学者
2025-04-17T05:12:07.000000Z
Researchers from Meta AI and UT Austin Explored Scaling in Auto-Encoders and Introduced ViTok: A ViT-Style Auto-Encoder to Perform Exploration
MarkTechPost@AI
2025-01-18T04:27:58.000000Z
一块显卡理解一部完整电影!智源联合多所高校推出小时级的超长视频理解大模型Video-XL
智源研究院
2024-10-28T11:10:07.000000Z
DeepSeek新作Janus:解耦视觉编码,引领多模态理解与生成统一新范式
机器之心
2024-10-22T08:11:46.000000Z
DeepSeek AI Releases Janus: A 1.3B Multimodal Model with Image Generation Capabilities
MarkTechPost@AI
2024-10-18T07:36:01.000000Z