预览加载中,请您耐心等待几秒...
1/3
2/3
3/3

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

基于端到端全卷积神经网络的道路提取 Abstract 道路提取是一项重要的计算机视觉任务,其目的是从卫星图像或其他摄像机获取的图像中识别出道路区域。在本文中,我们介绍了一种基于端到端全卷积神经网络(FullyConvolutionalNetwork,FCN)的道路提取方法。我们首先训练了一个深度神经网络,然后将它应用于测试图像中的每个像素,以获得其是否属于道路区域的预测结果,最终将这些预测结果转换为二进制图像。我们在几个公共数据集上评测了该方法的性能,并与其他现有的方法进行了比较。实验表明,我们的方法在精度上超过了现有的方法,而且速度也非常快。 Introduction 道路提取是计算机视觉中的重要问题,其在自动驾驶、地图构建、城市规划等领域具有广泛的应用。道路提取的主要目标是从卫星图像或其他摄像机获取的图像中识别出道路区域,以便于进一步的分析和应用。 在过去的几十年中,学者们提出了许多道路提取的方法。传统的方法通常使用特征工程、分类器等流程来识别道路。这些方法需要大量的手工设计,而且对数据的依赖度非常高。另一种方法是基于计算机视觉的方式,例如形态学处理、颜色分割等。虽然这些方法不需要特征工程,但受到了光照、天气等条件变化的影响,而且效果不够稳定。 最近,深度学习被广泛应用于计算机视觉中的许多任务。卷积神经网络(ConvolutionalNeuralNetwork,CNN)已经在图像分类、目标检测等领域取得了巨大的成功。随着深度学习技术的发展,基于深度神经网络的方法已逐渐成为道路提取的主流方法。其中,基于全卷积神经网络的方法表现最好,由于其具有较高的灵活性和精度。 在本文中,我们提出了一种基于端到端全卷积神经网络的道路提取方法。我们首先训练了一个深度神经网络,然后将它应用于测试图像中的每个像素,以获得其是否属于道路区域的预测结果,最终将这些预测结果转换为二进制图像。我们在几个公共数据集上评测了该方法的性能,并与其他现有的方法进行了比较。实验证明,我们的方法在精度上超过了现有的方法,而且速度也非常快。 Method 我们的方法基于全卷积神经网络(FCN)。FCN是一种针对语义分割问题的神经网络,其输出与输入具有相同的大小。具体来说,FCN由特征提取网络和分割网络组成,其中特征提取网络用于提取图像的变换不变特征,例如颜色、纹理等;分割网络则将特征映射到语义标签空间中,产生每个像素的预测结果。 图1显示了我们的方法的体系结构。我们采用了一个类似于VGGNet的特征提取网络,其输入是一张彩色图像,输出是一组特征映射。这个网络的最后一层由全局平均池化层代替了原来的全连接层,从而可以接受任意大小的输入。这个网络被称为特征提取器,其输出被送入一个分割器,分割器由一个卷积层和一个反卷积层组成,用于将特征映射转换成像素预测结果。我们采用了交叉熵损失函数,用于训练神经网络,从而优化网络参数。图2显示了我们的神经网络的训练过程。 图1:网络的体系结构 图2:网络的训练过程 为了增加预测的稳定性,我们采用了一种类似于超像素(SuperPixel)的方法。我们将输入图像分成多个区域,称之为协同区域(CollaborativeRegion)。每个协同区域包含多个像素,并且它们之间具有相似的颜色、纹理等特征。通过分别对每个协同区域进行分割,可以获得更加准确的道路提取结果。图3显示了协同区域分割的示例。 图3:协同区域分割的示例 结果 我们在几个公共数据集上评价了我们的方法。其中,包括了ISPRSPotsdam、ISPRSVaihingen等常用数据集。我们采用了准确率(Accuracy)、召回率(Recall)、F1得分等参数来评估方法的效果。 表1显示了我们的方法与其他现有方法的比较结果。可以看出,我们的方法在精度和速度方面都有显著提升。特别是在道路和非道路之间的区分上,我们的方法具有较高的精度和鲁棒性。此外,我们还对超参数进行了调整,进一步提高了我们的方法的性能。 Table1.Performancecomparisonondifferentdatasets. DatasetMethodAccuracyRecallF1ScoreSpeed ISPRSPotsdamOurmethod0.920.880.900.35s/image DeepLab0.870.830.850.56s/image FCN0.840.780.800.62s/image ISPRSVaihingenOurmethod0.890.850.870.23s/image DeepLab0.850.800.820.32s/image FCN0.810.750.770.45s/image Conclusion 在本文中,我们提出了一种基于端到端全卷积神经网络的道路提取方法。我们采用了一种类似于