热点
关于我们
xx
xx
"
MLLM
" 相关文章
社区供稿 | 阶跃星辰开源图像编辑模型 Step1X-Edit: 人人都能用的“改图大师”!
Hugging Face
2025-06-12T02:32:47.000000Z
ACL 2025 | 多维阅卷,智识觉醒:打开多模态大模型看图写作评估的认知之门
PaperWeekly
2025-06-11T09:17:56.000000Z
CVPR 2025:73%人类认同率,Video-Bench实现视频质量精准打
36氪 - 科技频道
2025-06-03T11:44:12.000000Z
ACL 2025 | MMUnlearner解耦视觉-文本知识,多模态大模型遗忘进入细粒度时代
PaperWeekly
2025-06-03T06:42:31.000000Z
ICLR2025 workshop | 浙大&阿里提出FILA:让多模态大模型看清高分辨率图像细节
我爱计算机视觉
2025-05-31T14:42:15.000000Z
【征稿&挑战赛】ACM MM 2025 第一届“多模态大模型统一理解和生成”研讨会&挑战赛
我爱计算机视觉
2025-05-25T13:57:18.000000Z
This AI Paper Introduces GRIT: A Method for Teaching MLLMs to Reason with Images by Interleaving Text and Visual Grounding
MarkTechPost@AI
2025-05-25T06:15:58.000000Z
ICML 2025 Spotlight|南洋理工陶大程教授团队等提出基于RAG的高分辨率图像感知框架,准确率提高20%
机器之心
2025-05-17T05:25:05.000000Z
社区供稿 | 阶跃星辰开源图像编辑模型 Step1X-Edit: 人人都能用的“改图大师”!
Hugging Face
2025-05-13T16:51:53.000000Z
社区供稿 | 阶跃星辰开源图像编辑模型 Step1X-Edit: 人人都能用的“改图大师”!
智源社区
2025-05-01T04:53:03.000000Z
UniME: A Two-Stage Framework for Enhancing Multimodal Representation Learning with MLLMs
MarkTechPost@AI
2025-04-29T20:40:39.000000Z
InternVL3开源:7种尺寸覆盖文、图、视频处理,多模态能力扩展至工业图像分析
魔搭ModelScope社区
2025-04-19T06:12:52.000000Z
谢赛宁等新作上线,多模态理解生成大一统!思路竟与GPT-4o相似?
智源社区
2025-04-14T04:47:37.000000Z
生图加入CoT,性能提升80%,微软港中文打造天才画手
36kr-科技
2025-04-08T07:34:53.000000Z
ICLR 2025 | 多模态大模型总"胡说八道"?「定位-修正」实现生成过程的幻觉抑制
智源社区
2025-03-28T03:17:39.000000Z
院士领衔万字长文,全面系统梳理多模态LLM对齐算法
智源社区
2025-03-24T16:51:11.000000Z
你正在做的大模型评测,可能有一半都是无用功 | 上海AI Lab&上交&浙大出品
智源社区
2025-03-20T11:33:19.000000Z
Meet PC-Agent: A Hierarchical Multi-Agent Collaboration Framework for Complex Task Automation on PC
MarkTechPost@AI
2025-03-15T20:45:27.000000Z
2025首篇关于多模态大模型在富文本图像理解上的全面研究综述
PaperAgent
2025-03-03T16:37:04.000000Z
多模态大模型对齐新范式,10个评估维度全面提升,快手&中科院&南大打破瓶颈
量子位
2025-02-27T07:27:41.000000Z