热点
关于我们
xx
xx
"
多模态大模型
" 相关文章
ACL'25 | CIGEval:一种基于多模态大模型的可控生图评测智能体
PaperAgent
2025-06-12T03:18:26.000000Z
社区供稿 | 书生·万象 3.0 升级发布,创新预训练方法
Hugging Face
2025-06-12T02:32:48.000000Z
AutoJudger|一个多模态大模型的自主评测智能体
智源社区
2025-06-11T10:58:06.000000Z
ACL 2025 | 多维阅卷,智识觉醒:打开多模态大模型看图写作评估的认知之门
PaperWeekly
2025-06-11T09:17:56.000000Z
35%准确率蒸发!字节&华科WildDoc揭示多模态文档理解鲁棒性短板
PaperWeekly
2025-06-08T06:37:42.000000Z
多模态模型挑战北京杭州地铁图!o3成绩显著,但跟人类有差距
智源社区
2025-06-08T05:32:58.000000Z
多模态推理新基准!最强Gemini 2.5 Pro仅得60分,复旦港中文上海AILab等出品
智源社区
2025-06-07T17:02:54.000000Z
上海AI实验室造出首个「通才」机器人大脑:看懂世界+空间推理+精准操控全拿下
36氪 - 科技频道
2025-06-05T07:49:30.000000Z
更强劲,更高效:智源研究院开源轻量级超长视频理解模型Video-XL-2
智源社区
2025-06-04T04:23:50.000000Z
单卡也能跑万帧!智源发布Video-XL-2,速度、效果、长度全拉满
智源社区
2025-06-04T04:23:50.000000Z
单卡也能跑万帧,智源发布Video-XL-2,速度、效果、长度全拉满
36kr
2025-06-03T07:24:17.000000Z
万帧?单卡!智源研究院开源轻量级超长视频理解模型Video-XL-2
机器之心
2025-06-03T06:51:16.000000Z
CVPR 2025 Highlight l 北大团队开源视觉搜索方法 DyFo,无需训练,提升多模态大模型细粒度理解能力
我爱计算机视觉
2025-06-01T12:52:13.000000Z
全面评估多模态模型视频OCR能力,Gemini 准确率仅73.7%
智源社区
2025-05-31T10:43:30.000000Z
一家智能眼镜公司,为什么非要自研AI大模型系统?|甲子光年
甲子光年
2025-05-30T12:14:19.000000Z
ByteBrain x 清华 VLDB25|时序多模态大语言模型 ChatTS
字节跳动技术团队
2025-05-30T09:31:00.000000Z
小米多模态大模型 MiMo-VL 开源,官方称多方面领先 Qwen2.5-VL-7B
IT之家
2025-05-30T08:13:54.000000Z
测评 | 从实验室到茶水间,可量产万元全尺寸具身机器人全网首测
极客公园官网
2025-05-29T14:26:20.000000Z
全彩显示的AI眼镜来了!8999元带走阿里大模型和最强光波导
智源社区
2025-05-28T13:34:40.000000Z
【明日主题前瞻】小米YU7预约咨询量超过同期SU7,留资用户数达3倍左右
深度财经头条
2025-05-28T12:55:27.000000Z