我爱计算机视觉 2024年10月09日
YOLOv1-v11系列全记录
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

YOLO系列模型是高效的目标检测模型,从YOLOv1到YOLOv10,经过多次迭代改进,提高了检测精度和速度。各版本在不同方面有所创新,且部分版本已上线社区项目。

YOLOv1将目标检测转化为单一回归问题,通过一次前向传播同时预测物体边界框及类别概率,为后续版本奠定基础。

YOLOv2在V1基础上使用多种技术提高模型精度和鲁棒性,在VOC 2007测试集上mAP明显提升。

YOLOv5由Ultralytics推出,更易用、部署简单且性能卓越,有多种尺寸以适应不同计算需求。

YOLOv10由清华大学开源,提出NMSfree训练的一致双分配等改进,在性能和效率上有优化。

算力君 2024-10-09 12:42 江苏

附开源地址




关注公众号,发现CV技术之美




YOLO(You Only Look Once)系列模型是一类非常高效的目标检测模型。其主要特点是能够在单次前向传播中同时进行目标的定位和分类,实现实时的目标检测。

YOLO 系列模型从最初的 YOLOv1 到 YOLOv10,经过了多次迭代和改进,逐渐提高了检测的精度和速度。

近期,ultralytics 团队再次更新,YOLOv11 问世,速度更快、更准确。

YOLO简史

YOLOv11

YOLOv11 是 Ultralytics YOLO 系列的最新版本,基于之前 YOLO 版本的成功,引入了新特性和改进,进一步提升性能和灵活性。与 YOLOv8 相比,它具有更少的参数和更好的结果。

YOLOv11 是进行目标检测与跟踪、实例分割、图像分类和姿态估计等广泛任务的优秀选择。

YOLOv1

YOLOv1架构图

2015 年,Joseph Redmon 及其团队革命性地推出了 YOLOv1(You Only Look Once version 1),这一里程碑式的实时目标检测模型彻底颠覆了传统检测方法的框架。

YOLOv1 凭借其独特的设计理念——将目标检测任务转化为一个单一的回归问题,仅通过一次前向传播即可同时预测出图像中物体的边界框及其类别概率,极大地提升了检测速度与效率,为后续版本的迭代与优化奠定了坚实的基础。。

定性结果

YOLOv2

次年,原班底提出 YOLO9000,作为 YOLO 系列的第二代力作,在 V1 的基础上做了很多改进,包括使用批量归一化、锚框、维度聚类、多尺度训练和测试等技术来提高模型的精度和鲁棒性。在标准的 VOC 2007 测试集上,YOLOv2 达到了 76.8% 的 mAP,比 YOLOv1 的 63.4% 有了明显提升。

YOLOv3

YOLOv3 是 YOLO 系列目标检测模型的第三个版本,由 Joseph Redmon和Ali Farhadi 于 2018 年提出。YOLOv3 在继承前两代 YOLO 模型优点的基础上,进行了多项改进,包括使用更高效的骨干网络、多锚和空间金字塔池,使其在检测精度和速度上达到了更高的平衡。

YOLOv4

YOLOv4(开发团队:Institute of Information Science, Academia Sinica, Taiwan)于 2020 年发布,引入 Mosaic 数据增强、新的无锚检测头和新的损失函数等创新技术。

YOLOv5

YOLOv5s网络架构

YOLOv5 是由 Ultralytics 推出的一个版本,虽然并非 YOLO 创始团队推出,但因其更易用、部署简单且性能卓越,迅速在业界赢得广泛赞誉与普及。YOLOv5 继续优化了检测速度和精度,并支持导出为多种格式(如TFLite、ONNX、CoreML和TensorRT)。

YOLOv5 相较于第四版,在网络结构、数据预处理、损失函数、激活函数、优化器和学习率调整、运行效率方面都有改进,提高了模型精度、速度,在实际应用中更有效。

其缺点是对于小目标、密集物体检测方面还有待提升。

模型变体:YOLOv5 有几种尺寸(n、s、m、l、x),以适应不同的计算需求:

图源网络

YOLOv6

YOLOv6 是美团研发的一款目标检测框架,致力于工业应用。

主要贡献:

YOLOv7

YOLOv7 与 YOLOv4 出自同一个团队,该版本增加了额外的任务,如 COCO 关键点数据集的姿势估计。

另外,该版本在 5FPS 到 160FPS 的范围内,在速度和精度上都超过了所有(此版本以前)已知的目标检测器,在 GPU V100 上以 30 FPS 或更高的速度在所有已知的实时目标检测器中具有最高的精度 56.8%AP。

YOLOv8

YOLOv8 与 YOLOv5 出自同一个团队,该版本支持全方位的视觉 AI 任务,包括检测、分割、姿态估计、跟踪和分类。这种多功能性使用户能够在各种应用和领域中利用 YOLOv8 的功能。

YOLOv9

PGI
GELAN

YOLOv9 由中国台湾 Academia Sinica、台北科技大学等机构联合开发,基于 YOLOv7 进行改进,引入了可编程梯度信息 (PGI) 和广义高效层聚合网络 (GELAN) 等创新方法。

与 YOLOv8 相比,两者的结合设计使深度模型的参数数量减少了 49%,计算量减少了 43%,但在 MS COCO 数据集上仍有 0.6% 的 AP 改进。

YOLOv10

NMS-free

YOLOv10 由清华大学开源,其中两大改进是:

YOLOv10 在各种模型规模上都达到了最先进的性能和效率。例如,在 COCO 上类似的 AP 下,YOLOv10-S 比 RT-DETR-R18 快 1.8 倍,同时参数和 FLOP 数量减少 2.8 倍。与 YOLOv9-C 相比,在相同的性能下,YOLOv10-B 的延迟减少了 46%,参数减少了 25%。

YOLOv10 绝非技术的终点,继续期待新的突破与创新!

智汇全球,趋动未来

『社区项目』汇聚全球智慧,促进技术交流的宝贵平台,期待每一位AI爱好者体验一键部署功能的强大魅力。

目前,YOLO 系列已有部分版本上线『社区项目』,欢迎前来体验。

趋动云『社区项目』体验入口:


趋动云是面向企业、科研机构和个人 AI 开发者构建的开发和推理训练服务,也是全球首个基于 GPU 算力池化云的服务。
趋动云的使命是连接算力·连接人:
?通过连接全球算力,趋动云可以为用户提供便宜、好用的 AI 算力。
?通过为AI算法开发全流程提供优化服务、构建全球开发者项目和数据社区,趋动云可以帮助AI开发者接入丰富的生态,快速实现最佳实践。

阅读原文

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

YOLO系列 目标检测 模型改进 社区项目
相关文章