回复
Ultralytics新作-YOLOv11
本文介绍视觉目标检测模型YOLOv11。
2024年9月30日,在YOLOVision活动上,Ultralytics团队正式宣布发布YOLOv11。短短2年,YOLO就从YOLOv8一下子迭代到YOLOv11,可见目前AI的发展速度。
感兴趣的小伙伴可以看看官方的仓库:https://github.com/ultralytics/ultralytics
模型介绍
对比YOLOv8(Ultralytics前一代出品),主要有三个模型结构的变化:
- C3k2机制。上图为C3k的网络结构图,2是指调用时C3k其中的参数N固定设置为2。不过从结构上来说,C3k2其实就是YOLOv8中的C2f,两者结构是一致的。
- 第二个创新点是提出C2PSA机制,如上图所示。其实就是在C2模块的基础上,引入了Attention机制,提出了一种PSA的模块,不过个人认为替换为卷积层的效果应该也不会差太多的。
- 第三个创新点是在原先的2个解耦分类检测头中,进一步增加了两个DWConv,提高了模型的特征提取能力。如上图所示。
模型效果
上图为官方贴出的YOLOv11效果图,从图中可以看到,YOLOv11相比于第5代到10代,其无论是从精度还是速度上都是达到了最优的结果,说明了YOLOv11的性能强大。
另外,官方也展示了在边缘部署上的性能,这里与v10进行对比。在v11上的mAP为39.5,v10上的mAP为38.5;在延迟方面,在v11上延迟为1.55 , v10上延迟为1.84。这可能看起来像是一种微量增加,但小小数的增加可能会对边缘部署的模型产生很大影响。
文转载自公众号瓦力算法学研所,作者:喜欢瓦力的卷卷
赞
收藏
回复
相关推荐