热点
"MLLM" 相关文章
社区供稿 | 阶跃星辰开源图像编辑模型 Step1X-Edit: 人人都能用的“改图大师”!
智源社区 2025-05-01T04:53:03.000000Z
UniME: A Two-Stage Framework for Enhancing Multimodal Representation Learning with MLLMs
MarkTechPost@AI 2025-04-29T20:40:39.000000Z
InternVL3开源:7种尺寸覆盖文、图、视频处理,多模态能力扩展至工业图像分析
魔搭ModelScope社区 2025-04-19T06:12:52.000000Z
谢赛宁等新作上线,多模态理解生成大一统!思路竟与GPT-4o相似?
智源社区 2025-04-14T04:47:37.000000Z
生图加入CoT,性能提升80%,微软港中文打造天才画手
36kr-科技 2025-04-08T07:34:53.000000Z
ICLR 2025 | 多模态大模型总"胡说八道"?「定位-修正」实现生成过程的幻觉抑制
智源社区 2025-03-28T03:17:39.000000Z
院士领衔万字长文,全面系统梳理多模态LLM对齐算法
智源社区 2025-03-24T16:51:11.000000Z
你正在做的大模型评测,可能有一半都是无用功 | 上海AI Lab&上交&浙大出品
智源社区 2025-03-20T11:33:19.000000Z
Meet PC-Agent: A Hierarchical Multi-Agent Collaboration Framework for Complex Task Automation on PC
MarkTechPost@AI 2025-03-15T20:45:27.000000Z
2025首篇关于多模态大模型在富文本图像理解上的全面研究综述
PaperAgent 2025-03-03T16:37:04.000000Z
多模态大模型对齐新范式,10个评估维度全面提升,快手&中科院&南大打破瓶颈
量子位 2025-02-27T07:27:41.000000Z
小红书&上交多模态大模型新基准,Gemini 1.5 Pro准确率仅48%
我爱计算机视觉 2025-02-26T13:56:30.000000Z
专题征稿 | 生成式人工智能的安全与伦理
智源社区 2025-02-18T03:22:09.000000Z
谢赛宁、李飞飞「空间智能」新作:多模态大模型仍难突破空间推理
36kr-科技 2024-12-23T08:51:36.000000Z
This AI Paper from Microsoft and Oxford Introduce Olympus: A Universal Task Router for Computer Vision Tasks
MarkTechPost@AI 2024-12-22T07:42:43.000000Z
ChatRex: A Multimodal Large Language Model (MLLM) with a Decoupled Perception Design
MarkTechPost@AI 2024-12-01T08:04:56.000000Z
把大象放冰箱!算法与系统协同优化,vivo与港中文推出BlueLM-V-3B,手机秒变多模态AI专家
我爱计算机视觉 2024-11-30T12:26:11.000000Z
算法系统协同优化,vivo与港中文推出BlueLM-V-3B,手机秒变多模态AI专家
机器之心 2024-11-30T05:39:38.000000Z
高效评估多模态预训练对齐质量,中科大提出模态融合率MIR
机器之心 2024-11-04T07:25:26.000000Z
Waymo 利用谷歌 Gemini 大语言模型,开发端到端自动驾驶模型
IT之家 2024-10-31T07:08:09.000000Z