预览加载中,请您耐心等待几秒...
1/9
2/9
3/9
4/9
5/9
6/9
7/9
8/9
9/9

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN109272048A(43)申请公布日2019.01.25(21)申请号201811157800.9(22)申请日2018.09.30(71)申请人北京工业大学地址100124北京市朝阳区平乐园100号(72)发明人刘博史超张佳慧(74)专利代理机构北京思海天达知识产权代理有限公司11203代理人沈波(51)Int.Cl.G06K9/62(2006.01)权利要求书1页说明书4页附图3页(54)发明名称一种基于深度卷积神经网络的模式识别方法(57)摘要本发明公开了一种基于深度卷积神经网络的模式识别方法,主要是一种基于深度卷积神经网络,引入attention机制及图像增强手段的模式识别方法。首先拿到样本数据集,由相关专业人员对数据集图像进行标注,对图像做灰度处理,这样可以凸显出主要目标的轮廓,有利于特征提取,然后利用随机旋转不同角度对数据集进行扩充,再对图像数据做增强以及数据预处理,最后构建出能够高效提取图像特征的深度卷积神经网络,用建立好的数据集进行五折交叉验证对模型进行训练并测试,完成视觉辅助检测模型的构建。本发明在样本识别时运算效率更高,而模型参数减少,降低了资源的占用,以及对软硬件的高需求,可以更好投入到实际使用。CN109272048ACN109272048A权利要求书1/1页1.一种基于深度卷积神经网络的模式识别方法,其特征在于:该方法包括以下步骤:步骤1、构建一个169层的DenseNet模型,该DenseNet模型的主干结构是由4个密集连接的稠密块以及4个过渡层交替拼接而成,稠密块与过渡层之间会有若干个卷积核;每个稠密块内,在每次卷积操作开始前都要将之前所有的结果在通道方向上拼接,实现密集连接的特征图传递,一个具有L层的网络,那么highway稠密连接数目为L*(L+1)/2;模型的最后一层为一个Sigmoid输出的全连接层,输出分类结果;步骤2、对数据集加入噪声,对数据集中每张图片随机添加90、180、270三个角度的旋转,起到扩充数据集的目的;步骤3、对图像数据集进行相关预处理;步骤3具体包括以下步骤:步骤3.1、将每张图像进行灰度处理,凸显目标区域位置及轮廓纹理,并将图像压缩到256*256的尺寸;步骤3.2、对图像数据集中每张图像做FiveCrop到224,有50%几率对图像随机进行水平、竖直翻转;步骤3.3、使用ImageNet数据集的平均值与方差对数据集进行标准化处理,即对于图像中第i个点的原像素值xi求标准差其中μ和σ2分别代表ImageNet数据集的均值与方差;步骤3.4、将图像数据集随机生成五份数据集,每份图像数据集包含不同的训练集与验证集;训练集的数据占所有数据的80%,验证集的数据占所有数据的20%;步骤4、使用预处理好的数据集对DenseNet模型进行训练;步骤4具体包括以下步骤:步骤4.1、DenseNet模型的训练方法采用标准的Adam优化算法对DenseNet模型进行训练优化,训练时的batchsize为16;步骤4.2、在DenseNet模型的每个稠密块之间添加注意力模块;训练50个epoch,让DenseNet模型在训练过程中更关注目标区域;每个epoch之后DenseNet模型都会对验证集进行预测,记录DenseNet模型预测的准确率并输出,前20个epoch学习率设为0.001,第20次开始降为0.0001,第40次降为0.00001;通过五折交叉验证进行训练,生成最终的DenseNet模型作为最后结果;步骤4.3、保存生成的DenseNet模型,使用测试集的数据对模型分类的准确率做出评价。2.根据权利要求1所述的一种基于深度卷积神经网络的模式识别方法,其特征在于:DenseNet模型的整体训练平台是基于服务器,在Ubuntu系统上使用Pytorch深度学习框架实现;训练的GPU为两块GTX1080,并使用CUDA作为显卡的运算驱动。2CN109272048A说明书1/4页一种基于深度卷积神经网络的模式识别方法技术领域[0001]本发明属于深度学习计算机视觉领域,主要是一种基于深度卷积神经网络,引入attention机制及图像增强手段的模式识别方法。背景技术[0002]“特征提取+分类器”是模式识别领域的经典框架,即通过人力构建特征对图像进行表示,再将特征层面的图像数据送入分类器实现目标图像的分类识别。神经学研究表明人类大脑在处理视觉图像的过程并没有对特征进行抽取,而是将信号传入到一个由大量神经元组成的深度网络并层层传递最终得到信号的隐式表达。深度学习正是通过模拟人脑信号的传输过程让图像在网络中传播并输出图像的有效表示。卷积神经网络作为目前广泛应用的深度模型在计算机视觉及图像处理等领域的成功应用引起