预览加载中,请您耐心等待几秒...
1/8
2/8
3/8
4/8
5/8
6/8
7/8
8/8

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113705348A(43)申请公布日2021.11.26(21)申请号202110847407.8(22)申请日2021.07.27(71)申请人安徽中科有智科技有限公司地址230000安徽省合肥市包河区花园大道以南泰山路以东滨湖卓越城文华园7号楼6层602室(72)发明人佟剑瑞薛峰费吴俊(51)Int.Cl.G06K9/00(2006.01)G06K9/62(2006.01)G06N3/04(2006.01)G06N3/08(2006.01)权利要求书1页说明书5页附图1页(54)发明名称一种融合多注意力机制的行人重识别方法(57)摘要本发明公开了一种融合多注意力机制的行人重识别方法,包括:1、下载用于训练模型的数据集,并对数据集进行预处理;2、搭建融入多注意力机制的行人重识别网络,并选择合适的目标函数来优化模型参数;3、采用相应的评估指标来评价模型的效果;4、用训练好的模型对从视频中截取出的行人图片进行行人身份识别;本发明使用堆叠的多层卷积神经网络,并通过融合通道注意力机制和空间注意力机制来提取行人的细粒度特征,从而通过训练学习可以从行人图片中得到更加有效的高维特征,进而达到更加准确的行人重识别效果。CN113705348ACN113705348A权利要求书1/1页1.一种融合多注意力机制的行人重识别方法,其特征在于,包括以下几个步骤进行:步骤1、获取行人重识别数据集Market1501,并对数据集中的每张图片的大小进行归一化、随机裁剪和擦除数据增强,从而得到预处理后的图片集合,构成数据集L;步骤2、将步骤1中得到的行人图片数据集L划分为训练集和测试集,并将训练集划分为多个批次,每个批次包含P个身份的行人,每个行人含有K张图片,即每个批次包含B张行人图片作为训练样本,其中B=P×K;每个训练样本图片的通道个数为C、高度为H、宽度为W;步骤3、将训练集与测试集中每个行人图片所对应的真实标签分别记为和;步骤4、构建融合多注意力机制的行人重识别网络;行人重识别网络将ResNet50模型作为骨干网络,在ResNet50模型的基础上,在其第1个、第2个和第3个残差块之后均加入通道注意力机制,然后在其第4个残差块之后加入空间注意力机制,紧接着在空间注意力机制之后,再加入批正则化,并将全连接层中神经元的个数改为N。2.根据权利要求1所述的一种融合多注意力机制的行人重识别方法,其特征在于,所述步骤4包括:融入通道注意力机制、融入空间注意力机制、构建特征提取后端网络和进行智能训练;其中,步骤4.1、融入通道注意力机制;通道注意力网络CA包括三个支路,第一个支路依次包括:一个全局最大池化层、一个将输入特征通道数缩小r倍的卷积层、一个RELU激活函数以及一个将输入特征通道数增大r倍的卷积层;第二个支路除将全局最大池化层改为全局平均池化层以外,与第一个支路相同;第三个支路为跳跃连接,即输出等于输入;将第一个支路和第二个支路的输出经过逐元素相加后,再经过Sigmoid激活函数得到在通道维度上的权重偏好系数WC,然后将通道维度上的权重偏好系数WC和第三个支路的输出经过逐元素相乘即得到通道注意力模块的输出;步骤4.2、融入空间注意力机制;所述空间注意力网络SA包括两个支路,第一个支路依次包括:一个在通道维度上的求均值AVG操作和一个在通道维度上求最大值MAX操作,并将AVG和MAX得到的结果在通道维度上进行拼接,然后通过卷积层融合通道维度上的特征,紧接着通过一个Sigmoid激活函数得到在空间维度上的权重偏好系数WS;第二个支路为跳跃连接,即输出等于输入;将空间维度上的权重偏好系数WS和第二个支路的输出经过逐元素相乘即得到空间注意力模块的输出;步骤4.3、构建特征提取后端网络;后端网络包括一个批正则化BN层和一个全连接FC层;后端网络的输入为所述空间注意力网络SA的输出;步骤4.4、进行智能训练;以训练集作为所述行人重识别网络的输入,并以与训练集所对应的行人真实标签集合作为标签,采用TripletLoss和CrossEntropyLoss作为损失函数,利用Adam优化算法对行人重识别网络进行训练,不断优化网络参数,最终得到最优的行人重识别网络,用于实现对从监控视频中截取出的行人进行重识别。3.根据权利要求2所述的一种融合多注意力机制的行人重识别方法,其特征在于,步骤4.4中,行人真实标签集合和BN层之后得到的特征用于计算TripletLoss,行人真实标签集合和全连接FC层之后得到的特征用于计算CrossEntropyLoss。2CN113705348A说明书1/5页一种融合多注意力机制的行人重识别方法技术领域[0001]本发明涉及计算机机器学习与人工智能技术领域,具体是一