热点
关于我们
xx
xx
"
视觉语言模型
" 相关文章
视觉感知RAG × 多模态推理 × 强化学习 = VRAG-RL
PaperAgent
2025-06-12T03:18:26.000000Z
视觉感知驱动的多模态推理:阿里通义提出VRAG-RL,定义下一代检索增强生成
PaperWeekly
2025-06-11T09:17:56.000000Z
每周AI论文速递(2506202-250606)
掘金 人工智能
2025-06-08T06:14:06.000000Z
英伟达发布 Llama Nemotron Nano VL AI:高效精准,攻克复杂文档解析难题
IT之家
2025-06-05T00:13:15.000000Z
NVIDIA AI Releases Llama Nemotron Nano VL: A Compact Vision-Language Model Optimized for Document Understanding
MarkTechPost@AI
2025-06-04T06:55:52.000000Z
5700问答对全面评估拷问AI空间感!最新空间智能评测基准来了丨浙大&成电&港中文
智源社区
2025-06-04T04:23:50.000000Z
Study shows vision-language models can’t handle queries with negation words
MIT News - Machine learning
2025-06-03T02:58:26.000000Z
LuminX Secures $5.5M to Make Warehousing Intelligent with Vision Language Models on the Edge
Unite.AI
2025-06-02T16:27:34.000000Z
MiMo-VL-7B: A Powerful Vision-Language Model to Enhance General Visual Understanding and Multimodal Reasoning
MarkTechPost@AI
2025-06-02T15:55:53.000000Z
5700问答对全面评估拷问AI空间感!最新空间智能评测基准来了丨浙大&成电&港中文
量子位
2025-06-02T08:41:48.000000Z
5700问答对全面评估拷问AI空间感!最新空间智能评测基准来了丨浙大&成电&港中文
量子位
2025-06-02T05:38:56.000000Z
SFT在帮倒忙?新研究:直接进行强化学习,模型多模态推理上限更高
机器之心
2025-06-01T08:01:31.000000Z
让AI学着“看菜下碟”!港中大等新框架让推理长度减少90%,准确率反增17%
量子位
2025-05-30T08:56:19.000000Z
让AI学着“看菜下碟”,港中大等新框架让推理长度减少90%,准确率反增17%
36kr
2025-05-30T08:04:18.000000Z
RSS 2025|从说明书学习复杂机器人操作任务:NUS邵林团队提出全新机器人装配技能学习框架Manual2Skill
机器之心
2025-05-29T07:31:13.000000Z
One RL to See Them All?一个强化学习统一视觉-语言任务!
机器之心
2025-05-27T07:20:30.000000Z
Researchers Introduce MMLONGBENCH: A Comprehensive Benchmark for Long-Context Vision-Language Models
MarkTechPost@AI
2025-05-23T06:00:52.000000Z
2025.05.19 | Qwen3提升LLMs性能;GuardReasoner-VL强化VLM安全。
HuggingFace 每日AI论文速递
2025-05-19T23:07:56.000000Z
See, Think, Explain: The Rise of Vision Language Models in AI
Unite.AI
2025-05-19T19:07:33.000000Z
85倍速度碾压:苹果开源FastVLM,能在iphone直接运行的视觉语言模型
机器之心
2025-05-17T05:25:06.000000Z