预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN109345507A(43)申请公布日2019.02.15(21)申请号201810972498.6(22)申请日2018.08.24(71)申请人河海大学地址211100江苏省南京市江宁区佛城西路8号(72)发明人刘凡杨丽洁毛莺池许峰辛仰鑫(74)专利代理机构南京经纬专利商标代理有限公司32200代理人施昊(51)Int.Cl.G06T7/00(2017.01)权利要求书2页说明书5页附图2页(54)发明名称一种基于迁移学习的大坝图像裂缝检测方法(57)摘要本发明公开了一种基于迁移学习的大坝图像裂缝检测方法,步骤:收集大坝裂缝图像,通过生成式对抗网络GAN对图像数据集进行预处理以填充数据集;采用不保留顶层全连接层的预训练模型MobileNet来提取图像特征,并在MobileNet后拼接Flatten层,在Flatten层后拼接一层激活函数为ReLU的全连接层,最后拼接一层激活函数为Sigmoid的全连接层作为输出层;对MobileNet中的前K个深度可分解卷积结构进行冻结,固定这K个深度可分解卷积结构的相关权重;对模型进行训练,在模型训练过程中仅更新未冻结的网络层的权重;利用训练好的模型在图像中对大坝裂缝的检测。本发明解决了小数据集情况下的过拟合问题,并通过迁移学习思想提高了预测性能和运行速度。CN109345507ACN109345507A权利要求书1/2页1.一种基于迁移学习的大坝图像裂缝检测方法,其特征在于,包括以下步骤:(1)收集大坝裂缝图像,通过生成式对抗网络GAN,对图像数据集进行预处理以填充数据集,从而减小因数据集数量不够而产生过拟合的影响;(2)构建网络模型:采用不保留顶层全连接层的预训练模型MobileNet来提取图像特征,并在MobileNet后拼接Flatten层,在Flatten层后拼接一层激活函数为ReLU的全连接层,最后拼接一层激活函数为Sigmoid的全连接层作为输出层;MobileNet包含13个深度可分解卷积结构;(3)对MobileNet中的前K个深度可分解卷积结构进行冻结,固定这K个深度可分解卷积结构的相关权重,1≤K≤13;(4)模型训练:将损失函数loss设置为对数损失,对模型进行训练,在模型训练过程中仅更新未冻结的网络层的权重;(5)模型训练完成后,通过使用滑动窗口截取测试图像在不同位置的窗口图像作为输入数据在模型中进行识别,根据输出结果判断该位置是否有裂缝,实现在图像中对大坝裂缝的检测。2.根据权利要求1所述基于迁移学习的大坝图像裂缝检测方法,其特征在于,在步骤(1)中,生成式对抗网络GAN包含一个生成器G和一个判别器D,生成器G接收一个随机的噪声z,通过这个噪声生成新的样本图像,记做G(z);判别器D判别接收的图像的真假,并输出接收图像是真实图像的概率,若输入是真实图像,则输出就越接近1,否则输出越接近0;通过训练使生成式对抗网络GAN达到动态均衡的状态,即生成器G生成的图像接近于真实图像分布,同时判别器D对于给定图像的预测为真的概率接近0.5;训练完成后,利用生成器G输出伪裂缝图填充数据集,对原始图像数据集进行填充。3.根据权利要求2所述基于迁移学习的大坝图像裂缝检测方法,其特征在于,在步骤(1)中,训练生成式对抗网络GAN的过程如下:(11)在噪声数据分布中随机采样,输入生成器G,得到伪造的裂缝图G(z);(12)在真实数据分布中随机采样,作为真实数据x;(13)将前两步中某一步产生的数据作为判别器D的输入,此时判别器D能判别出两者的差异,即D(G(z))接近于0,D(x)接近于1;(14)训练判别器D是最小化交叉熵的过程,判别器D的损失函数为:其中,Pdata(x)为真实数据分布,Pg(x)为生成器G的数据分布,E(·)表示数学期望值;则GD生成器G的损失函数Obj(θG)=-Obj(θD,θG);(15)根据判别器和生成器的损失函数,采用交替优化的方法,先固定生成器G,优化判别器D,使判别器D的判别准确率最大化;然后固定判别器D,优化生成器G,使判别器D的判别准确率最小化;当且仅当Pdata(x)=Pg(x)时达到全局最优解,训练完成。4.根据权利要求1所述基于迁移学习的大坝图像裂缝检测方法,其特征在于,步骤(2)的具体过程如下:(21)固定MobileNet最开始的输入图像尺寸为128*128*3,其中3为图像深度,MobileNet中的每个深度可分解卷积结构均包含2层卷积层,即首先使用一组2D的卷积核,2CN109345507A权利要求书2/2页这一组2D卷积核的数量与输入通道数相同,卷积核的通道数为1,每次仅处理一个输入通道,逐个输入通道卷积处理后,再使用3D的1*1卷积核来处理,将最终