我爱计算机视觉 01月12日
征稿 | CVPR 2025 Workshop 第一届像素级视觉基础模型研讨会征稿启动
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

视觉基础模型在自然语言处理领域取得进展,但其在视觉领域仍处初中期。本次研讨会汇聚研究者,探讨像素级理解任务的方向、应用、风险等,包括多场报告及论文提交等内容。

基础模型在自然语言处理领域进展显著,视觉领域仍在发展

视觉基础模型如DINO、CLIP等不断涌现,像素级模型也在发展

研讨会探讨像素级理解任务的方向及潜在应用,包括多种任务

研讨会还将讨论模型可能带来的风险及缓解方法

组委会 2025-01-11 22:31 江苏

提交截止日期:2025年3月4日




关注公众号,发现CV技术之美




近年来,基础模型(Foundation Models)在自然语言处理领域取得了显著进展,其中以 GPT 系列为代表。这些模型规模庞大,通过自监督学习或视觉语言建模训练于多样化的数据集上,展现了强大的适应能力和泛化性能,尤其在零样本和小样本任务中表现出色。然而,与语言基础模型已相对成熟相比,视觉领域的基础模型及其在各种任务中的应用仍处于发展的初中期阶段。

尽管如此,视觉基础模型(Vision Foundation Models, VFM)正吸引越来越多的关注并取得持续进展。一些最新的模型包括基于自监督训练的 DINO 系列,以及结合图像和文本数据的 CLIP、Flamingo 和 Llava 等。此外,像素级视觉基础模型也在近年涌现,如 OMG-LLava 和 SAM 系列。

本次研讨会旨在汇聚致力于开发和应用视觉基础模型于像素级理解任务的研究者,共同探讨这一领域的重要方向,包括图像分割、视频分割、目标追踪、动作-行为分割、深度估计及运动估计等。研讨会将重点讨论视觉基础模型在像素级理解任务中的潜在应用机会,特别是在低资源环境下可能带来的社会积极影响。例如,这些模型能够为缺乏大规模标注数据集的边缘化社区提供支持。同时,我们将探讨这些模型可能带来的风险及其缓解方法。

研讨会将包括7场主题报告,涵盖新兴研究者与资深专家的多样化视角,还设有两场海报展示和精选论文报告。我们鼓励提交任何与视觉基础模型在像素级理解任务中的研究或应用相关的文章,共同推动这一领域的发展。


研讨会和征稿主题

我们鼓励提交符合以下主题的研究论文,同时也欢迎其他与视觉基础模型在像素级理解任务中相关的研究:

投稿时间节点


研讨会报告嘉宾


研讨会组织者


END




欢迎加入「CVPR交流群?备注:CVPR




阅读原文

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

视觉基础模型 像素级理解 研讨会 自然语言处理
相关文章