目录

YOLO11官方代码调试小结1

目录

YOLO11官方代码调试小结1

用作学习积累笔记。

损失函数部分:

https://i-blog.csdnimg.cn/direct/6f7a11025a0e48379ed75b23f5d68702.png#pic_center

1.Na是指你的网络有多少个预测头,yolov7指定了有3个head

https://i-blog.csdnimg.cn/direct/8a6dfdd6210e47aa963393b7b7f4722c.png

2.nt是指你的真实图像GT中有42个真实框

https://i-blog.csdnimg.cn/direct/a62cebf64540440c88f3639eb60ad457.png

3.target7个维度分别表示1.batch,2.类别(5种) 3456xywh 7ai(他是哪个na,3个框中的哪一个)

https://i-blog.csdnimg.cn/direct/e550bbb4343c4e41b6dbf6ef8f29aa6d.png

4.主干网络的模块都在D:\Pycharm\ultralytics-main\ultralytics\nn\modules\block.py

https://i-blog.csdnimg.cn/direct/044bf68d26a148aca5734a51881619a8.png

5.主干网络里面指定的C3k2模块为false

https://i-blog.csdnimg.cn/direct/02d4b6bc94764fb09b262db002bf5304.png

6.Yolov11.yaml的地址:D:\Pycharm\ultralytics-main\ultralytics\cfg\models\11

https://i-blog.csdnimg.cn/direct/5ebbec3cd2354a07b237056afcf75da0.png

7.Tasks.py在nn文件夹下,他就是以前的yolo.py文件

m(x) 观看你运行到了第几层

https://i-blog.csdnimg.cn/direct/892c9294c0444176a1e774b4c31b6268.png

8.走到第二个卷积层,k为3,步长为2,输入x为128

https://i-blog.csdnimg.cn/direct/3bc6410793cc410a87f365eab599c6e6.png

https://i-blog.csdnimg.cn/direct/3d90f017cee64bedb49f7b53200aa430.png

https://i-blog.csdnimg.cn/direct/74a47d654c604c4784ca2e903cb7be89.png

9.y为2时,进入第3层,观察C3k2。

https://i-blog.csdnimg.cn/direct/4732fa9f061e408196a9e20a24b675be.png

10.C3K2为False时,跳入C2F,执行C2F前向传播过程。

图中看出x先送入cv1计算,也就是先经过卷积然后送入chunk切分

https://i-blog.csdnimg.cn/direct/59ee24ab82f24e2a9c0d8876f87e2919.png

如图所示,切割成2份。

https://i-blog.csdnimg.cn/direct/3de9ba30687245e29ffa55f3c9e416ab.png

11.self.m实际包含1个Bottleneck模块(例如图片中显示的Bottleneck(c2=32))。遍历self.m中的模块m(仅1个),对当前y[-1](即1)进行处理:m(1)输出特征图m1_out,shape保持(B, 16, 64, 64)。torch.cat(y, 1)将3个特征图沿通道拼接,得到(B, 48, 64, 64)。

https://i-blog.csdnimg.cn/direct/cfbffaf3658041ec8b5759e8e231ec5c.png

12.当为true时,先分两条路卷积1,卷积2,然后卷积1走了两个bottleneck模块,z最后把他们俩拼装。

13.C2PSA模块解析:

https://i-blog.csdnimg.cn/direct/bf0f84f0b75e4877ab37295072fc87d2.png

https://i-blog.csdnimg.cn/direct/0c011e993f254dc2b228b43fcf03d24e.png

14.进入forward可以看到他被平均分成了ab两块,b送入了m,最后把他们拼接后送入卷积。

https://i-blog.csdnimg.cn/direct/0c12f1646337404eb264436c4944b343.png

15.M在此处就是一个PSABlock,残差和注意力机制和ffn

https://i-blog.csdnimg.cn/direct/8c7f8db860b848399626076adfb3da1a.png

https://i-blog.csdnimg.cn/direct/5e8a25489336436e8aa99ef930b9502c.png

注意力机制部分没有创新有待提高。