简介
内容
简介¶
要想现在就开始,请查看 快速入门指南。
YOLO 是什么¶
YOLO 是 “你只看一次”(You only look once) 的首字母缩写,是一种目标检测算法,它将图像划分为一个网格系统。网格中的每个单元负责检测其内部的物体。
由于其速度和准确率(accuracy),YOLO 是最著名的目标检测算法之一。
YOLO 历史¶
YOLOv4¶
随着原作者对 YOLO 的工作陷入停顿,YOLOv4 由 Alexey Bochoknovskiy、Chien-Yao Wang 和 Hong-Yuan Mark Liao 发布。
这篇论文的题目是 YOLOv4:目标检测的最佳速度和准确度
作者:Alexey Bochoknovskiy, Chien-Yao Wang 和Hong-Yuan Mark Liao
发表: 23 April 2020
YOLOv3¶
YOLOv3 在 YOLOv2 的基础上进行了改进,原作者 Joseph Redmon 和 Ali Farhadi 都有贡献。他们一起发表了 YOLOv3: An Incremental Improvement
作者:Joseph Redmon 和 Ali Farhadi
发表: 8 Apr 2018
YOLOv2¶
YOLOv2 是由 YOLO 的原作者 Joseph Redmon 和 Ali Farhadi 共同完成的。他们一起出版了 YOLO9000:更好、更快、更强
作者:Joseph Redmon 和 Ali Farhadi
发表: 25 Dec 2016
YOLOv1¶
YOLOv1 是由 Joseph Redmon 作为研究论文发布的。该论文的标题是 You Only Look Once: Unified, Real-Time Object Detection
发表: 8 Jun 2015
模型描述¶
YOLOv5🚀 是在 COCO 数据集上训练的复合尺度目标检测模型系列,包括测试时间增强(Test Time Augmentation,简称 TTA)、模型集成、超参数演化以及导出到 ONNX、CoreML 和 TFLite 的简单功能。
Model |
size (pixels) |
mAPval 0.5:0.95 |
mAPtest 0.5:0.95 |
mAPval 0.5 |
Speed V100 (ms) |
params (M) |
FLOPS 640 (B) |
|
---|---|---|---|---|---|---|---|---|
1280 |
43.3 |
43.3 |
61.9 |
4.3 |
12.7 |
17.4 |
||
1280 |
50.5 |
50.5 |
68.7 |
8.4 |
35.9 |
52.4 |
||
1280 |
53.4 |
53.4 |
71.1 |
12.3 |
77.2 |
117.7 |
||
1280 |
54.4 |
54.4 |
72.0 |
22.4 |
141.8 |
222.9 |
||
YOLOv5x6 TTA |
1280 |
55.0 |
55.0 |
72.0 |
70.8 |
表格描述
APtest 表示 COCO test-dev2017 的结果,所有其他 AP 结果表示 val2017 的 accuracy。
除非另有说明,AP 值是单模型单尺度的。通过
python test.py --data coco.yaml --img 640 --conf 0.001 --iou 0.65
重现 mAP。SpeedGPU 使用 GCP n1-standard-16 V100 实例对 5000 多张 COCO val2017 图像进行了平均,并包括 FP16 推理、后处理和 NMS。通过
python test.py --data coco.yaml --img 640 --conf 0.25 --iou 0.45
重现。所有检查点(checkpoints)都以默认设置和超参数(没有自动增强)训练到 300 个 epochs。
测试时间增强(TTA)包括反射(reflection)和尺度增强(scale augmentation)。通过
python test.py --data coco.yaml --img 1536 --iou 0.7 --augment
重现 TTA。