预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共19页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113743505A(43)申请公布日2021.12.03(21)申请号202111037457.6(22)申请日2021.09.06(71)申请人辽宁工程技术大学地址123000辽宁省阜新市细河区中华路47号(72)发明人肖振久杨玥莹(74)专利代理机构沈阳东大知识产权代理有限公司21109代理人李珉(51)Int.Cl.G06K9/62(2006.01)G06N3/04(2006.01)G06F17/16(2006.01)G06F17/11(2006.01)权利要求书2页说明书10页附图6页(54)发明名称基于自注意力和特征融合的改进SSD目标检测方法(57)摘要本发明提供一种基于自注意力和特征融合的改进SSD目标检测方法,涉及目标检测技术领域。该方法在SSD目标检测模型的基础上构建改进的SSD目标检测模型进行目标检测;改进的SSD目标检测模型在原SSD目标检测模型的基础上增加了自注意力机制,利用全局上下文信息,获得更大的感受野,以此得到更加细化的信息来指导目标检测;通过特征融合充分融合深层和浅层的特征信息,并使得融合后的特征层能同时包含丰富的几何细节和语义信息,有利于降低漏检和提高小目标检测的效果;损失函数引入FocalLoss损失,使得在训练时更注重于难分类样本的分类问题。既保留原SSD目标检测的优点,同时又更好地学习对象特性。CN113743505ACN113743505A权利要求书1/2页1.一种基于自注意力和特征融合的改进SSD目标检测方法,其特征在于:包括以下步骤:步骤1、通过公开的已标注的图片数据集训练SSD目标检测模型,获得SSD目标检测初始模型;步骤2、在步骤1获得的SSD目标检测初始模型的基础上构建改进的SSD目标检测模型;所述改进的SSD目标检测模型由特征提取模块、特征融合模块、自注意力模块和检测模块组成;所述特征提取模块与SSD目标检测初始模型结构相同,使用VGG16网络结构,包含:VGG16中所有的卷积层,并将VGG16中两个全连接层替换为卷积层,同时增加四个卷积结构,每个结构由两个卷积层构成;所述特征融合模块将特征提取模块中的卷积层和最大池化层、卷积层和卷积层进行融合,增强卷积层的特征映射;所述自注意力模块从特征层中输出的预测特征图中估计预测所需相关信息,构建特征图内部所有特征像素之间的全局依赖关系,针对不同区域进行目标检测;所述检测模块对通过自注意力模块得到的有效特征层中的每一个特征层均进行两次卷积操作,一次用于预测该特征层上每个特征点上每一个先验框的变化情况,另一次用于预测该特征层上每一个特征点上每一个预测对应的种类;所述特征点就是整个图片分成与其长宽对应的网格的中心;步骤3、通过公开的已标注的图片数据集再训练改进后的SSD目标检测模型;步骤4、将待检测的图像通过最终的SSD目标检测模型,实现对图像中的目标进行检测。2.根据权利要求1所述的基于自注意力和特征融合的改进SSD目标检测方法,其特征在于:所述步骤1对公开的已标注的图片数据集进行数据增强操作,使用这些数据对SSD目标检测模型进行训练,获得SSD目标检测初始模型。3.根据权利要求1所述的基于自注意力和特征融合的改进SSD目标检测方法,其特征在于:所述特征融合模块的融合过程如下公式所示:xi=RELU{WK{Concat[Tc(xi‑1),Tn(xi),Td(xi+1)]}}(1)其中,xi为第i层特征层,xi‑1为与第i层特征层相邻的前卷积层,xi+1为与第i层特征层相邻的后反卷积层,i=1、2、…、n,n为特征层总数,所述特征层为用于特征融合的卷积层;Tc为对输入特征层进行卷积、下采样、激活函数操作;Tn为对输入特征层进行卷积、激活函数操作;Td为对输入特征层进行反卷积、上采样、激活函数操作;将需融合的特征层xi‑1,xi和xi+1分别经过T操作后,进行Concat融合,最后经过3×3卷积操作,通过卷积WK和激活ReLU操作得到新特征层。4.根据权利要求3所述的基于自注意力和特征融合的改进SSD目标检测方法,其特征在于:所述自注意力模块从特征层中输出的预测特征图中估计预测所需相关信息,构建特征图内部所有特征像素之间的全局依赖关系,针对不同区域进行目标检测的具体方法为:(1)设定通过特征提取和特征融合操作得到的预测特征图为其中,C为特征图的通道数,N为特征图的总空间位置,t为比例尺,T为特征图尺寸,Ct和Nt分别为t比例尺换算后的特征图的通道数和总空间位置;2CN113743505A权利要求书2/2页(2)将预测特征图xt经过线性变换变换到Q、K和V三个不同的特征空间,变换公式如下:ttt其中,Q(x)、K(x)和V(x)分别为Q、K和V三个不同特征空间下的