预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共21页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN115908356A(43)申请公布日2023.04.04(21)申请号202211561248.6(22)申请日2022.12.07(71)申请人东华理工大学地址344000江西省抚州市学府路56号(72)发明人汪宇玲王杰(74)专利代理机构南昌华成联合知识产权代理事务所(普通合伙)36126专利代理师黄晶(51)Int.Cl.G06T7/00(2017.01)G06N3/048(2023.01)权利要求书3页说明书10页附图7页(54)发明名称一种基于LDLFModel的PCB缺陷检测方法(57)摘要本申请涉及一种基于LDLFModel的PCB缺陷检测方法,它包括如下步骤:对采集的PCB数据集进行增强;构建LDLFModel网络模型,模型的主干网络为MobileNetV3‑Small网络;在主干网络的最后一层和Neck部分加入位置注意力机制,并以Eiouloss作为模型的目标框损失函数,对模型进行训练;将待检测PCB数据集输入切割模块进行切割,再输入至训练好的模型中进行预测,最后将预测结果输入还原模块还原为最终的可视化结果。本发明使用LDLFModel网络模型作为检测模型,在保证检测精度的基础上,进一步的压缩模型的参数量和计算量,方便较低性能的设备部署,同时提高缺陷检测的效率和精度。CN115908356ACN115908356A权利要求书1/3页1.一种基于LDLFModel的PCB缺陷检测方法,其特征在于,包括如下步骤:S1:对采集的PCB数据集进行数据增强,形成训练数据;S2:构建深度学习轻量级融合网络模型,即LDLFModel网络模型;所述LDLFModel网络模型包括Backbone部分、Neck部分和Prediction部分;Backbone部分采用MobileNetv3‑Small作为特征提取网络,并在MobileNetv3‑Small的最后一层加入了位置注意力机制;Neck部分采用特征金字塔FPN和路径融合PAN相结合的方式进行特征融合,并在Neck部分中加入了位置注意力机制,获得增强的特征层;Prediction部分为YOLOhead模块,用于进行目标预测;S3:对所述LDLFModel网络模型进行训练,具体步骤如下:S301:将经过数据增强后的PCB数据集输入到所述LDLFModel网络模型的Backbone部分中,通过带注意力机制的MobileNetv3‑Small进行依次下采样后,获得三个不同分辨率的有效特征层;S302:将步骤S301中获得的三个有效特征层输入到Neck部分进行特征融合,对三个有效特征层依次进行上采样和下采样操作,采用快速归一化融合的方式进行特征融合,获得三个增强的有效特征层;S303:将步骤S302中获得的三个增强的有效特征层输入到YOLOhead模块中预测PCB缺陷目标的中心点位置,获取预测框宽高、置信度以及PCB缺陷目标类别信息,并采用目标框损失函数Eiouloss作为所述LDLFModel网络模型的损失函数ζEioU,提升预测框定位的准确性;S4:将训练好的LDLFModel网络模型用于识别PCB缺陷,获取缺陷检测结果,具体方法为:将待检测的PCB缺陷数据集输入切割模块进行切割,将待检测的PCB缺陷数据集切割成小图,左右相邻或者上下相邻的小图之间具有20%的重叠区域,将切割成的小图输入训练好的LDLFModel网络模型进行PCB缺陷检测,输出带有检测结果的小图,并将带有检测结果的小图输入还原模块进行拼接还原,获得最终的可视化检测结果。2.根据权利要求1所述的一种基于LDLFModel的PCB缺陷检测方法,其特征在于,所述步骤S1的具体方法为:对PCB数据集进行随机翻转、随机镜像、随机亮度变化以及随机缩放处理,进而扩充数据集的数量,然后采用Mosica数据增强的方式,获得最终的训练数据。3.根据权利要求1所述的一种基于LDLFModel的PCB缺陷检测方法,其特征在于,所述步骤S2中位置注意力机制用于进行坐标信息的嵌入和坐标信息的生成;坐标信息嵌入的原理为:对给定输入特征x,使用尺寸为(H,1)或(1,W)的池化核分别沿着水平坐标和垂直坐标对每个通道进行编码,输出的具体表达式为:其中,W为池化核的宽,m为池化核在W空间范围的取值,xc(h,m)为高度为h,W取m的特征图输入张量,为高度为h的第c通道的输出;宽度为w的第c通输出的具体表达式为:2CN115908356A权利要求书2/3页其中,H为池化核的高,n为池化核在H空间范围的取值,xc(n,w)为宽度为w,H取n的特征图输入张量,为宽度为w的第c通道的输出;坐标信息的生成原理为:经过坐标信息嵌入中的变换后,对变换后的输出结果进行Concat操作得到[zh,z