预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共23页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN116127120A(43)申请公布日2023.05.16(21)申请号202310101131.8(22)申请日2023.01.29(71)申请人入迷(成都)信息技术有限公司地址610096四川省成都市中国(四川)自由贸易试验区成都高新区天华二路219号天府软件园C区12栋5层501号(72)发明人张质子万黎明蒲磊(51)Int.Cl.G06F16/583(2019.01)G06F16/53(2019.01)G06F18/213(2023.01)G06N3/048(2023.01)G06N3/0464(2023.01)权利要求书3页说明书12页附图7页(54)发明名称一种大规模局部区域图像的检索方法(57)摘要本申请提供了一种大规模局部区域图像的检索方法,通过第一改进的VGG16特征提取网络获取图像数据库所有图像的深层特征。通深层特征,对原始图像中包含物体类的区域进行划分,获得区域子图。接着通过第二改进的VGG16特征提取网络以及主成分分析PCA对所有子图进行特征提取以及降维,更好的保留图像的局部特征信息,同时降低了计算开销。最后将待检索图片输入第三改进的VGG16特征提取网络进行特征提取并通过主成分分析PCA降维,得到的低维特征向量与特征数据库进行相似度计算,检索出与待检索图片最相似的若干张图片作为检索结果。通过待检索图像低维的特征向量与特征数据库进行计算,可以大大提高检索效率,并且获得优异的检索结果。CN116127120ACN116127120A权利要求书1/3页1.一种大规模局部区域图像的检索方法,其特征在于,包括以下步骤:S1、收集检索图像,构建检索的图像数据库;S2、构建第一改进的VGG16特征提取网络获取图像的深层特征;S3、通过深层特征,对原图像中包含物体类的区域进行划分,获得区域子图;S4、通过第二改进的VGG16特征提取网络对所有区域子图进行特征提取,获得特征向量;S5、通过主成分分析PCA对得到的特征向量进行降维,并存入特征数据库中;S6、将待检测图片输入第三改进的VGG16特征提取网络以及PCA得到特征向量,与特征数据库进行相似度计算,检索出与待检测图片最相似的若干张图片作为检索结果。2.根据权利要求1所述的一种大规模局部区域图像的检索方法,其特征在于,步骤S1所述收集Google‑Landmarks‑V2、PASCALVOC以及收集到的包括但不限于JPEG(JointPhotographicExpertsGroup)、PNG(PortableNetworkGraphics)等格式的图像作为图像数据库。3.根据权利要求2所述的一种大规模局部区域图像的检索方法,其特征在于,步骤S2所述构建第一改进的VGG16特征提取网络获取图像的深层特征;所述第一改进的VGG16特征提取网络包括顺次连接的第一至第二卷积层、第一混合注意力机制层、第一最大池化层、第八至第九卷积层,第二混合注意力机制层、第二最大池化层、第十至第十二卷积层、第三混合注意力机制层、第三最大池化层、第十三至第第十五卷积层、第四混合注意力机制层;所述图像数据库中所有图像作为所述第一改进的VGG16特征提取网络的输入;所述第四混合注意力机制层的输出作为第一改进的VGG16特征提取网络的输出。4.根据权利要求3所述的一种大规模局部区域图像的检索方法,其特征在于,所述混合注意力机制层MixAttentionBlock包括并行的两条特征提取路径第一特征提取路径和第二特征提取路径;所述第一条特征提取路径把输入特征向量沿X和Y两个方向分别连接第一X‑AvgPooling层和第一Y‑AvgPooling层进行平均池化;所述第一X‑AvgPooling层的输出顺次连接包括第三卷积层、第一批标准化层、第一GELU激活函数层、第一WDBlock层;所述第一Y‑AvgPooling层的输出顺次连接包括第四卷积层、第二批标准化层、第二GELU激活函数层、第二WDBlock层;所述第一WDBlock层和第二WDBlock层的输出特征向量与残差路径特征向量进行矩阵乘法操作得到输出向量1;所述输出张量1作为第一VANBlock的输入端,顺次连接第五卷积层、第三GELU激活函数层、第三WDBlock模块层。所述输出张量1与权重分配模块第三WDBlock层的输出进行相加操作得到第一条特征提取路径的输出;所述第二条特征提取路径对输入特征向量(C,H,W)分别在C,H,W三个进行维度之间的信息交互。通道信息交互1(H,C,W)顺次连接通道池化第一Z‑Pooling层、第六卷积层、第三批标准化层;所述第三批标准化层的输出特征向量进行Permute调换操作,还原为特征通道(C,H,W),得到输出特征向量2。2CN1161271