AI & Big Data 9小时前
Meta發表DINOv3自監督影像模型,跨領域任務表現創新高並開放商用
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

Meta公司发布了新一代自我监督式学习(SSL)视觉模型DINOv3,该模型在训练规模、参数量及多项电脑视觉基准测试中均有显著提升,尤其在密集预测任务上表现优异。DINOv3延续了DINO系列无需人工标注的训练理念,通过大规模未标注影像学习高分辨率影像特征,大大降低了下游任务的开发成本和数据需求。模型规模扩大、数据集增加,且支持多种任务的骨干权重微调,特别适用于资源受限和多任务部署场景。其在语意分割、深度估测和视频跟踪等方面的性能均大幅超越前代,并在卫星、医疗、工业影像等领域展现出广泛的应用潜力,例如在环境监测中已实现林冠高度估计的显著改进。Meta同时提供了商用授权的程式码和预训练骨干模型,助力开发者加速AI在各行业的落地。

🌟 DINOv3在电脑视觉任务上表现卓越:Meta发布的新一代视觉模型DINOv3,在语意分割、单一影像深度估测及影片追蹤等密集预测任务上,其表现超越了前代DINOv2及其他现有方案,在ADE-20K语意分割和NYU深度估测等评测中均取得了领先成绩。

💡 自监督学习降低应用门槛:DINOv3秉承了DINO系列在自监督影像表征学习的核心理念,无需人工标注数据,通过大规模未标注影像进行训练,生成高解析度影像特征,使得下游任务仅需极少标注和轻量级微调即可获得良好结果,显著降低了开发成本和数据获取难度。

🚀 模型规模与效率的提升:相较于DINOv2,DINOv3的模型规模扩大了7倍,数据集规模增加了12倍,且在不微调骨干权重的情况下即可支持多任务,这大大降低了模型推论成本,使其特别适合边际计算和多任务同时部署的情境。

🌐 跨领域应用前景广阔:DINOv3的应用范围已从网络影像扩展至卫星、医疗和工业影像等标注困难或成本高昂的领域。例如,通过与MAXAR卫星影像结合,在环境监测中显著提高了林冠高度估计的精度,为气候融资和保育计划提供了有力支持。

📦 开源与商用授权加速落地:Meta已正式释出DINOv3的程式码与预训练骨干模型,并提供商用授权,包括多种规模的模型版本,方便研究机构和企业在合法框架下将其集成到产品和服务中,从而加速AI在医疗诊断、环境监控、自主系统和零售等多个行业的应用。

Meta宣布推出新一代自我監督式學習(Self-supervised Learning,SSL)視覺模型DINOv3,將訓練規模擴展至17億張影像,模型參數達到70億,在多項電腦視覺基準測試中,尤其是語義分割、單一影像深度估測及影片追蹤等密集預測任務上,表現超越前代與多個現有方案,並正式釋出商用授權的程式碼與預訓練骨幹模型,降低開發者在多領域應用上的採用門檻。

DINOv3延續DINO系列在自監督影像表徵學習的核心理念,不依賴人工標註資料,而是透過大規模未標註影像進行訓練,產生高解析度的影像特徵,讓後續的下游任務只需極少標註與輕量微調模組(Lightweight Adapter),即可取得良好的結果。

相較於前一代DINOv2,DINOv3的模型規模擴大為7倍,資料集規模增加12倍,並在不進行骨幹(Backbone)權重微調的情況下,即能支援多種任務,降低了開發與模型推論的成本,特別適用於邊緣運算與同時多任務的部署情境。

在官方公開的評測中,DINOv3在ADE-20K語義分割取得55.9分,優於DINOv2的49.5與SigLIP 2的42.7,而在NYU深度估測中誤差下降至0.309,低於DINOv2的0.372與SigLIP 2的0.494。DAVIS影片追蹤達到83.3,大幅領先其他模型。此外,在ImageNet ReaL分類上,DINOv3以90.4分與SigLIP 2持平,ObjectNet分類雖略低於PE(Perception Encoder),但在iNaturalist 2021精細分類則以89.8分領先。

DINOv3的應用範圍不限於一般網路影像,也能延伸至衛星、醫療與工業影像等標註困難或成本高昂的領域。Meta同步提供一個以MAXAR衛星影像訓練的專用骨幹,並在環境監測領域已有落地案例。世界資源研究所(WRI)使用DINOv3進行林冠高度估計,平均誤差由4.1公尺降至1.2公尺,有助於自動化驗證森林復育成效,加快氣候融資撥付流程,並支持大規模的保育與復育計畫。

Meta此次釋出多種規模的DINOv3骨幹,包括適用於資源受限環境的ConvNeXt版本,並附上部分下游評估模型與範例Notebook,方便開發者在不同任務整合使用。Meta提供DINOv3商用授權,研究單位與企業可在合法框架下將DINOv3整合進產品與服務,加速在醫療診斷、環境監控、自主系統及零售等多個產業的應用落地。

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

Meta DINOv3 视觉模型 自监督学习 电脑视觉
相关文章