预览加载中,请您耐心等待几秒...
1/9
2/9
3/9
4/9
5/9
6/9
7/9
8/9
9/9

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN109034162A(43)申请公布日2018.12.18(21)申请号201810769340.9(22)申请日2018.07.13(71)申请人南京邮电大学地址210003江苏省南京市鼓楼区新模范马路66号(72)发明人周全卢竞男杨文斌王雨从德春(74)专利代理机构南京苏科专利代理有限责任公司32102代理人姚姣阳(51)Int.Cl.G06K9/34(2006.01)权利要求书2页说明书4页附图2页(54)发明名称一种图像语义分割方法(57)摘要本发明揭示了一种图像语义分割方法,包含编码和解码两部分,其中编码端基于经典的FCN的模型包含了一系列的卷积操作和最大池化操作来提取特征,且卷积后特征图的通道数加倍,最大池化后特征图的长和宽减半;解码端先把编码端卷积层提取的特征图进行不同倍数的上采样,然后和解码端两倍上采样的特征图连接,再进行卷积提取综合特征。这样浅层的信息和深层的信息能较好的融合,最终网络输出一个21维且和原图大小相同的矩阵。本发明技术方案的提出并应用,重新定义了网络结构,通过结合解码端和解码端的特征图,充分地利用了网络的上下文信息,在一定程度上提高了最终的准确率;并且保留了分割图相对原始图像的分辨率大小。CN109034162ACN109034162A权利要求书1/2页1.一种图像语义分割方法,其特征在于所述方法包含:编码端基于经典的FCN的模型包含了一系列的卷积操作和最大池化操作来提取特征,且卷积后特征图的通道数加倍,最大池化后特征图的长和宽减半;解码端先把编码端卷积层提取的特征图进行不同倍数的上采样,然后和解码端两倍上采样的特征图连接,再进行卷积提取综合特征,将浅层和深层的信息融合,最终网络输出一个21维且和原图大小相同的矩阵。2.根据权利要求1所述图像语义分割方法,其特征在于包括步骤:S1、输入一张任意大小的图像,对图像进行两次相同的卷积,卷积核大小为3×3,卷积核个数为64,步长为1,得到通道数为64的第一特征图;S2、对第一特征图进行步幅为2的2×2最大池化操作,每次池化后特征图的长宽都缩减一半,接着再进行两次相同的卷积,卷积核大小为3×3,卷积核个数为128,步长为1,得到通道数为128的第二特征图;S3、重复S2的操作三次,其中卷积核的个数分别为256、512、1024,卷积后的结果分别记为第三特征图、第四特征图、第五特征图;S4、对第二特征图进行两倍上采样,保持通道数不变,得第六特征图;S5、对第三特征图进行两倍上采样,保持通道数不变,得第七特征图,再对第三特征图进行四倍上采样,保持通道数不变,得第八特征图;S6、对第四特征图进行两倍上采样,保持通道数不变,得第九特征图,对第四特征图进行四倍上采样,保持通道数不变,得第十特征图,对第四特征图进行八倍上采样,保持通道数不变,得第十一特征图;S7、对第五特征图进行两倍上采样,同时通道数减半为512,得第十二特征图,第四、第十二特征图长宽相同、通道数之和为1024,将两者特征图堆叠在一起,并再进行两次3×3的卷积,通道数减半为512,得第十三特征图;S8、对第十三特征图进行两倍上采样,同时通道数减半为256,得第十四特征图,第三、第九和第十四特征图长宽相同,通道数之和为1024,将三者特征图堆叠在一起,再进行两次3×3的卷积,通道数减半为256,得第十五特征图;S9、对第十五特征图进行两倍上采样,同时通道数减半为128,得第十六特征图,第二、第七、第十和第十六特征图长宽相同,通道数之和为1024,将四者特征图堆叠在一起,再进行两次3×3的卷积,通道数减半为128,得第十七特征图;S10、对第十七特征图进行两倍上采样,同时通道数减半为64,得第十八特征图,第一、第六、第八、第十一和第十八特征图长宽相同,通道数之和为1024,将五者特征图堆叠在一起,再进行两次3×3的卷积,通道数减半为64;S11、使用1×1的卷积,把64维的特征矢量映射到所需的类别个数,最终输出一个21维的和矩阵。3.根据权利要求1所述图像语义分割方法,其特征在于:每一次卷积前对图像周围补一圈0的填充操作。4.根据权利要求1所述图像语义分割方法,其特征在于:每一次卷积后衔接一个修正的线性单元。5.根据权利要求1所述图像语义分割方法,其特征在于:卷积核的大小和个数任意可2CN109034162A权利要求书2/2页选。3CN109034162A说明书1/4页一种图像语义分割方法技术领域[0001]本发明涉及一种图像计算机视觉分析和处理方法,具体涉及一种采用深度学习实现图像语义分割的方法。背景技术[0002]伴随着计算机视觉研究的不断加深,研究者逐渐将目光投向对于图像更为准确的分析和理解。语义分割问题正是为了满足这一