预览加载中,请您耐心等待几秒...
1/7
2/7
3/7
4/7
5/7
6/7
7/7

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN115761845A(43)申请公布日2023.03.07(21)申请号202211368669.7(22)申请日2022.11.03(71)申请人电子科技大学长三角研究院(湖州)地址313001浙江省湖州市西塞山路819号南太湖科技创新综合体B1幢(72)发明人许文波王树臣贾海涛罗欣常乐冷庚(51)Int.Cl.G06V40/16(2022.01)G06N3/0464(2023.01)G06N3/08(2023.01)G06V10/25(2022.01)G06V10/77(2022.01)G06V10/80(2022.01)G06V10/82(2022.01)权利要求书1页说明书4页附图1页(54)发明名称一种基于改进的MTCNN人脸检测方法(57)摘要本发明公开了一种基于改进的MTCNN的人脸检测方法。我们首先在通过一种使用生成对抗网络的超分辨率技术——SRGAN,将低像素图像转换为高像素图像,SRGAN使用反学习方法,结合像素均方误差、VGG高维特征均方误差和针对训练损失的深度卷积网络来实现超分辨率恢复。在原有MTCNN网络结构中创新性地引入了InceptionV2网络结构,提高了网络的学习性能,既保留了原有网络结构的优点,又进一步提高了人脸检测算法的效率和准确性。该模块通过对特征图进行三种不同的卷积(1×1,3×3,5×5)来提取更多的特征。不同的卷积检查对不同位置的人脸具有不同的学习效果。使用不同的卷积核进行学习可以更好地达到理想的学习效果。CN115761845ACN115761845A权利要求书1/1页1.一种基于改进的MTCNN人脸检测方法,其特征在于,包括以下步骤:1.进行图像预处理;由于在实际操作中,人脸检测图像受外部因素的影响很大,通过SRGAN(使用生成对抗网络的超分辨率)技术,超分辨率恢复是将低像素图像转换为高像素图像,SRGAN使用反学习方法,结合像素均方误差、VGG高维特征均方误差和针对训练损失的深度卷积网络来实现超分辨率恢复;网络输入不引入任何随机变量,而是直接输入图像,然后输出图像,其结构类似于自动编码器。生成器首先将输入图像编码为高维特征,然后通过残差网络处理特征,最后对恢复的高像素图像进行解码;通过上述图像预处理过程,使图像中的人脸更加清晰,其应用特征更加突出,更易于检测;2.在原有MTCNN网络结构中引入了Inception模块,提高了网络的学习性能,既保留了原有网络结构的优点,又进一步提高了人脸检测算法的效率和准确性。该模块通过对特征图进行三种不同的卷积(1×1,3×3,5×5)来提取更多的特征。不同的卷积检查对不同位置的人脸具有不同的学习效果;使用不同的卷积核进行学习可以更好地达到理想的学习效果;卷积核卷积后提取的特征图和池化层的结果作为输出进行聚合,但这种结构中参数的快速增加将导致大量的计算量;在改进方案中,在3×3,5×5卷积之前和池化层之后增加1×1卷积以降低维数;它不仅提取了大量的特征,而且减少了计算量;1×1卷积核神经元在不改变原始图像信息的情况下,对特征映射进行了维数深化,并在生成的特征映射中引入了非线性因素;本发明采用了InceptionV2模块;引入的InceptionV2模块在原有MTCNN网络结构的3×3卷积核和3×3池化层前增加了1×1卷积核,并将原有的3×3卷积核优化为1×3和3×1,提高了网络的学习率;3.训练改进的MTCNN网络,具体包括:使用交叉熵损失函数确定人脸分类输出损失;使用欧几里德损失函数确定人脸框位置回归输出损失和人脸关键点位置回归输出损失,再将人脸分类输出损失、人脸框位置回归输出损失和人脸关键点位置回归输出损失进行加权求和,确定对应网络层的总损失。2CN115761845A说明书1/4页一种基于改进的MTCNN人脸检测方法技术领域[0001]本发明涉及深度学习中的目标检测领域,具体涉及一种改进的MTCNN人脸检测方法。背景技术[0002]人脸检测技术可以在一张图片中检测出人脸的位置和数量。这种技术可以将检测出的人脸输出到人脸识别的模型中,以便于进行人脸识别的相关工作。其还可以应用在视频监控领域,用来捕获视频中的人脸个数。将其应用在相机中,相机通过检测人脸,可以实现自动对焦。[0003]传统的人脸检测技术存在着检测准确率低和运行速度慢的问题,而基于深度学习的人脸检测技术可以有效的改善这些问题。现有基于深度学习进行人脸检测的技术包括:R‑CNN、FastR‑CNN、FasterR‑CNN、MTCNN等等,但MTCNN模型因检测准确度较高,同时运行速度较快而在业界受欢迎。[0004]MTCNN模型是有三个部分组成的:P‑net(Proposalnet),R‑net(Refinenet)