预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共11页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN114972965A(43)申请公布日2022.08.30(21)申请号202210416206.7(22)申请日2022.04.20(71)申请人乐知未来科技(深圳)有限公司地址518129广东省深圳市龙岗区坂田街道社区黄军山综合楼801-826(72)发明人刘怀亮梁玮麟赵舰波杨斌(74)专利代理机构西安嘉思特知识产权代理事务所(普通合伙)61230专利代理师辛菲(51)Int.Cl.G06V20/00(2022.01)G06V10/764(2022.01)G06V10/82(2022.01)G06V10/80(2022.01)G06V10/774(2022.01)权利要求书1页说明书7页附图2页(54)发明名称一种基于深度学习的场景识别方法(57)摘要本发明公开了一种基于深度学习的场景识别方法,包括:对待识别的原始图片进行预处理,获得尺寸和通道一致的待识别图像;构建深度学习网络,并对所述深度学习网络进行训练,获得训练后的深度学习网络模型,其中,所述深度学习网络包括目标检测网络单元、场景识别网络单元、第一特征融合单元、注意力网络单元以及第二特征融合单元;将所述待识别图像输入训练后的深度学习网络模型中,获得图像的场景识别结果。本发明通过低‑高层特征的融合,结合注意力机制,增加图像特征中的细节信息,可以对原始图片进行有效的场景分类。CN114972965ACN114972965A权利要求书1/1页1.一种基于深度学习的场景识别方法,其特征在于,包括:对待识别的原始图片进行预处理,获得尺寸和通道一致的待识别图像;构建深度学习网络,并对所述深度学习网络进行训练,获得训练后的深度学习网络模型,其中,所述深度学习网络包括目标检测网络单元、场景识别网络单元、第一特征融合单元、注意力网络单元以及第二特征融合单元,其中,所述目标检测网络单元用于获得所述待识别图像的目标特征向量;所述场景识别网络单元用于获得所述待识别图像的场景特征向量;所述第一特征融合单元用于对所述目标特征向量和所述场景特征向量进行融合,获得带有目标属性和场景属性的融合特征向量;所述注意力网络单元用于根据所述融合特征向量获得待识别图像的全局特征信息和局部特征信息;所述第二特征融合单元用于将所述目标特征向量、所述场景特征向量、所述全局特征信息和所述局部特征信息进行融合,并获得场景分类结果;将所述待识别图像输入训练后的深度学习网络模型中,获得图像的场景识别结果。2.根据权利要求1所述的基于深度学习的场景识别方法,其特征在于,所述目标检测网络单元为Yolo网络,所述场景识别网络单元为去掉最后全连接层的Resnet18网络。3.根据权利要求1所述的基于深度学习的场景识别系统,其特征在于,所述注意力网络单元包括全局特征网络和局部特征网络,其中,所述全局特征网络包括依次连接的第一全局平均池化层、第一全连接层、第二全连接层、sigmoid激活函数层和第二全局平均池化层,其中,所述第一全局平均池化层用于对所述融合特征向量中每一层的特征图进行全局平均,获得一个包含全局上下文信息的特征值,所述第一全连接层和所述第二全连接层用于捕捉所述特征值通道之间的相关性,所述sigmoid激活函数层用于学习通道的权重因子,所述第二全局平均池化层用于获得每个通道的全局特征信息;所述局部特征网络包括注意力残差模块和第三全局平均池化层,所述注意力残差模块用于增强所述融合特征向量的局部细节信息,获得注意力图,所述第三全局平均池化层用于根据所述注意力图提取局部特征信息。4.根据权利要求3所述的基于深度学习的场景识别方法,其特征在于,对所述深度学习网络模型进行训练,包括:利用具有场景标签和场景中目标标签的大量图像组成图像训练集;利用所述图像训练集中的图片对所述深度学习网络模型进行训练,获得训练后的深度学习网络模型。5.根据权利要求3所述的基于深度学习的场景识别方法,其特征在于,所述第二特征融合单元为哈德玛融合单元,用于将所述目标检测网络单元提取的目标特征向量、场景识别网络单元提取的场景特征向量、所述全局特征网络单元提取的全局特征向量以及所述局部特征网络提取的局部特征向量进行融合,并通过softmax进行分类。6.一种存储介质,其特征在于,所述存储介质中存储有计算机程序,所述计算机程序用于执行权利要求1至5中任一项所述基于深度学习的场景识别方法的步骤。7.一种电子设备,其特征在于,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器调用所述存储器中的计算机程序时实现如权利要求1至5任一项所述基于深度学习的场景识别方法的步骤。2CN114972965A说明书1/7页一种基于深度学习的场景识别方法技术领域[0001]本发明属于场景识别技术领域,具体涉及一种基