YOLOv6:下一代对象检测-审查和比较
回到博客主页

YOLOv6:下一代对象检测-审查和比较

数据科学 2022年6月28日,

近年来,计算机视觉领域发展迅速,取得了几年前看起来像科幻小说的成果。从分析x射线图像在(半)自动驾驶汽车上诊断病人,我们正在见证一场正在发生的革命。这些突破有很多原因——构建更好的、更容易访问的计算资源,还有一个事实是,它们是我们不得不做的最接近的事情雷竞技技官网下载开源数据科学(osd)。向社区公开源代码可以解锁“大众的智慧”,并实现大规模的创新和解决问题。

计算机视觉中最受欢迎的操作系统项目之一是YOLO (YO原来l的书O不错的)。YOLO是一种高效的实时目标检测算法,在开创性的2015年首次描述约瑟夫·雷德蒙等人。YOLO将图像划分为网格系统,每个网格在其内部检测对象。它可以用于实时推理,需要的计算资源非常少。

今天,在YOLO第一版发布7年后,美团研究组发布了新的YOLOv6模型——它在这里踢了一脚!

YOLO的历史

YOLO前的目标检测

在YOLO之前,两阶段目标检测体系结构主导了该领域。它使用基于区域的分类器来定位区域,然后将它们传递给更健壮的分类器。虽然该方法给出了准确的结果,具有较高的平均平均精度(mAP),但它是非常资源密集型的,需要在其操作中多次迭代。

两阶段对象检测体系结构

YOLO是如何运作的?

YOLO提出了一种不同的方法,这两个阶段在同一个神经网络中进行。首先,将图像划分为单元,每个单元具有等维的SxS区域。然后,每个单元格根据对象标签和单元格中出现的事物的概率,用边界框坐标(相对于它的坐标)检测和定位它包含的对象。

YOLOv1架构

因为每个单元“独立工作”,它可以同时处理网格,减少所需的计算能力和训练和推断所需的时间。事实上,YOLO取得了最先进的结果,击败了其他实时目标检测算法。

YOLO有哪些版本?

YOLOv6在这里踢A**和取名字

MT-YOLOv6的灵感来自最初的一级YOLO架构,因此(勇敢地)被任命为YOLOv6的作者。尽管它提供了出色的结果,但必须注意MT-YOLOv6不是官方YOLO系列的一部分。

YOLOv6是专门用于工业应用的单级对象检测框架,具有硬件友好的高效设计和高性能。它在检测精度和推断速度上优于YOLOv5,使其成为生产应用程序YOLO体系结构的最佳操作系统版本。

YOLOv6成就

  • YOLOv6-nano-使用TensorRT FP16进行bs32推理,在COCO val2017数据集上实现35.0 mAP,在T4上实现1242 FPS
  • YOLOv6-s-使用TensorRT FP16进行bs32推理,在COCO val2017数据集上实现43.1 mAP,在T4上实现520 FPS。

单张图片推断

单图像推理

yolov6(红色)提供了比YOLOv5之前所有版本更好的平均平均精度(mAP),推理时间大约快2倍。我们还可以看到,基于yolo的体系结构与基于两阶段对象检测的effecentdet之间存在巨大的性能差距。

视频推理

视频推理

与单幅图像推理相同,YOLOv6在所有FPS谱上都提供了更好的视频结果。注意到550-620 FPS的曲线变化是很有趣的。我想知道这是否与硬件性能有关,维护人员在进行实验时是否降低了硬件的偏倚。

基准

  • 对不同目标探测器的mAP和速度进行了比较可可val2017数据集。
  • 其他方法的速度结果在维护人员的环境中使用官方代码库和模型进行测试,如果没有从相应的官方版本中找到的话。

免责声明:以上评论是基于作者的说法,我们还有待核实。

YOLOv5与YOLOv6

YOLOv5和YOLOv6的基准比较

在研究这两个模型的基准时,我发现很难进行比较。YOLOv6的模型类型更少(缺少m/l/x),并且没有关于大于640像素的图像的任何信息。对于两个项目报告的基准测试,我们可以清楚地看到YOLOv6的mAP的改进。然而,v6的参数和Flops数量是v5的2倍,这让我想自己深入到训练过程中,仔细检查下面的结果。

YOLOv5和YOLOv6的基准比较

YOLOv5和YOLOv6的定性比较

我使用两种模型的s版本来检测以下图像上的对象

YOLOv6s结果
YOLOv6s结果
YOLOv5s结果
YOLOv5s结果
YOLOv6s结果
YOLOv6s结果
YOLOv5s结果
YOLOv5s结果
YOLOv6s结果
YOLOv6s结果
YOLOv5s结果
YOLOv5s结果

我们可以清楚地看到,YOLOv6s在图像中检测到更多的对象,对他们的标签有更高的置信度。

灵活性

这两个项目都有创建不同模型大小的相似方法。最大的区别是YOLOv5使用YAML,而YOLOv6直接在Python中定义模型参数.初步的观察还表明,YOLOv5在一定程度上可能更具可定制性。

然而,YOLOv6如此灵活的事实意味着,未来我们可以看到更大版本的YOLOv6,预测精度甚至更高!

如果创建一个较大的YOLOv6模型,请在Discord上告诉我们!我们很想看!

使用

您可以使用DagsHub的应用程序与YOLOv6的最新版本进行交互.如果你想在本地机器上使用它,请遵循以下步骤:

安装

git克隆//www.kkolawyers.com/nirbarazida/YOLOv6 cd YOLOv6 pip install -r requests .txt dvc pull

推理

  • 使用YOLOv6s

Python工具/inf .py——weights yolov6 .pt——source <图像的路径/目录>

  • 使用YOLOv6n

Python工具/inf .py——weights yolov6n.pt——source <图像的路径/目录>

结论

YOLOv6是最近发布的最令人兴奋的OSDS项目之一。与以前的YOLO版本相比,它提供了最先进的结果,在所有方面都有显著的改进。维护者目前专注于丰富模型的类型、部署选项和量化工具。尽管如此,与任何开源项目一样,社区可以雷竞技技官网下载极大地影响其路线图和进度曲线。

虽然该项目仍处于早期阶段,但它看起来非常有前景,我很想知道它在未来会打破什么其他基准。

标签

近红外光谱Barazida

数据科学家@ DAGsHub

太棒了!您已经成功订阅。
太棒了!接下来,完成签出以获得完全访问权限。
欢迎回来!您已经成功登录。
成功!您的帐户已完全激活,您现在可以访问所有内容。