预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共15页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN114419659A(43)申请公布日2022.04.29(21)申请号202111514599.7(22)申请日2021.12.13(71)申请人中南大学地址410083湖南省长沙市岳麓区麓山南路932号(72)发明人韩锟曾向东肖友刚李蔚(51)Int.Cl.G06V40/10(2022.01)G06V10/764(2022.01)G06V10/82(2022.01)G06K9/62(2022.01)G06N3/04(2006.01)G06N3/08(2006.01)权利要求书3页说明书9页附图2页(54)发明名称一种复杂场景下的安全帽佩戴检测方法(57)摘要本发明公开了一种基于多尺度特征的安全帽佩戴检测方法,该方法包含:在YOLOv5网络骨干部分引入注意力机制,减少网络中有效信息在传递中的损失;在YOLOv5网络颈部和头部增加第四个检测尺度104×104,增强对小目标的检测能力;在大型数据集上对CSPDarkNet53模型进行预训练后,迁移学习其特征提取能力至安全帽佩戴检测模型,缓解数据集不充足的问题;根据安全帽佩戴检测框推断人体边界框,提取未佩戴安全帽人员的骨架关键点,设计步态识别模块,识别未佩戴安全帽人员身份;本发明在复杂场景下利用多尺度特征提高了安全帽佩戴检测模型的准确率,并且通过融合步态识别算法实现了未佩戴安全帽人员身份的确认。CN114419659ACN114419659A权利要求书1/3页1.一种复杂场景下的安全帽佩戴检测方法,其特征在于,该方法包括:步骤A,根据复杂场景下检测目标在画面中尺寸变化大的特点,设计安全帽检测的四个特征尺度;在YOLOv5网络检测颈部和头部的基础上增加感受野更小的第四个检测尺度,增强对小目标的检测效果,增加后四个检测尺度分别为13×13,26×26,52×52,104×104,相比于原来的三个尺度具有更大的尺度检测范围;YOLOv5训练时,其边界框回归的目标函数与真实值Bgt和预测值B有关,其计算如公式(1)所示,其中d为真实值的中心Cgt和预测框的中心c之间的距离,1为真实值和预测框最小外接矩形的对角线长度,IoU为两个矩形框的交并比,其计算如公式(2)所示,α为权重参数,其定义如公式(3)所示,v为纵横比一致性,根据真实值和预测框的宽wgt,w和高hgt,h计算,如公式(4)所示,根据损失函数计算公式可以确定生成更多合适的预测框能够提升网络的训练效果;步骤B,在YOLOv5骨干网络中引入注意力机制,设计改进后的YOLOv5网络,减少低层有效信息提取到高层时的损失;引入第四个检测尺度会导致网络层数加深,低层信息向高层信息传递时会产生损失,因此引入注意力机制减少信息损失,提高传输效率,同时使网络可以注意到图像中的小目标;H′×W′×C′H×W×C对于卷积映射Ftr:X→U,X∈R,U∈R,vc表示第c个卷积核,那么输出U=[u1,u2,…,uc],如式(5)所示,uc=vc*X(5)引入的注意力机制包括挤压操作和激发操作,挤压操作将一个通道的空间特征编码为一个全局特征,采用全局平均池化实现,如公式(6)所示,而激发操作采取sigmoid(σ)激活函数如式(7)所示,s=Fex(z,W)=σ(g(z,W))=σ(W2δ(W1z))(7)其中δ为RELU激活函数,r为降维比例;最后将学习到的各通道权重赋予原始特征得到最后输出如公式(8)所示,x=s·u(8)注意力机制让模型更加关注信息量最大的通道特征,抑制不重要的通道特征,本发明引入了2个SE模块,引入位置为骨干网络中第二个和第三个卷积拼接操作前;步骤C,从精度和速度两方面设计评价指标评价检测效果,对检测效果较差的类别进行2CN114419659A权利要求书2/3页针对性数据扩充和CutMix数据增强;为了对比模型改进带来的提升,将改进后的模型和改进前的模型在同一训练集和测试集上进行训练和测试,并从精度和速度两个方向进行评估,在精度方面计算指标精确率(precision),召回率(recall)并绘制PR曲线,计算平均精度均值(MAP),其计算公式如公式(9),公式(10)和公式(11)所示,其中真正(TP)是被模型正确预测的目标数目,假正(FN)是将其它物体错误的预测为目标的数目,假负(FN)为没有被模型正确预测出的真值的数量;n为类别数目,对于每一类,平均精度(APi)为相应PR曲线下的面积;在速度方面则以在相同测试集上的平均检测时间为指标;评估完成后对检测效果较差的类别进行针对性数据扩充和CutMix数据增强;令x∈RW×H×C和y分别代表训练目标和其标签,则对于A和B两张图片CutMix数据增强操作如公式(12)和公式(13)所示,其中M∈{0,1}W