预览加载中,请您耐心等待几秒...
1/7
2/7
3/7
4/7
5/7
6/7
7/7

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN112487126A(43)申请公布日2021.03.12(21)申请号202011460052.9G06N20/00(2019.01)(22)申请日2020.12.11(71)申请人重庆邮电大学地址400065重庆市南岸区黄桷垭崇文路2号(72)发明人刘明皓李银兴文汝杰(74)专利代理机构北京同恒源知识产权代理有限公司11275代理人赵荣之(51)Int.Cl.G06F16/29(2019.01)G06Q10/04(2012.01)G06Q10/06(2012.01)G06Q50/26(2012.01)G06F17/18(2006.01)权利要求书1页说明书4页附图1页(54)发明名称基于随机森林-点到面克里金回归的多源数据人口空间化方法(57)摘要本发明涉及一种基于随机森林‑点到面克里金回归的多源数据人口空间化方法,属于互联网与计算机技术领域。该方法具体包括:驱动因子筛选与数据处理:预处理采集的地理空间数据和社会感知数据,生成辅助数据并将其生成网格化的协变量数据;栅格数据升尺度聚合:将网格化的协变量数据聚集到县级行政单元,生成人口普查单位尺度上的协变量;将人口普查数据和县级行政单元数据结合得到县级行政单元的人口密度数据;对人口普查数据和协变量执行随机森林,然后对随机森林的残差分量执行面到点克里金回归;将精细网格尺度下的面到点克里金回归结果与保留的随机森林结果相结合,得到基于随机森林‑点到面克里金回归的网格化人口分布图。CN112487126ACN112487126A权利要求书1/1页1.一种基于随机森林‑点到面克里金回归的多源数据人口空间化方法,其特征在于,该方法具体包括以下步骤:S1:驱动因子筛选与数据处理:对采集到的地理空间数据和社会感知数据进行预处理,生成辅助数据;将辅助数据生成网格化的协变量数据;S2:栅格数据升尺度聚合:将网格化的协变量数据聚集到县级行政单元,生成人口普查单位尺度上的协变量;将人口普查数据和县级行政单元数据结合得到县级行政单元的人口密度数据,作为模型的因变量;S3:对人口密度数据和协变量执行随机森林,然后对随机森林的残差分量执行面到点克里金回归;S4:将精细网格尺度下的面到点克里金回归结果与保留的随机森林结果相结合,得到基于随机森林‑点到面克里金回归的网格化人口分布图。2.根据权利要求1所述的多源数据人口空间化方法,其特征在于,步骤S1中,生成的辅助数据包括:投影变换、剪裁矢量数据和栅格数据。3.根据权利要求1所述的多源数据人口空间化方法,其特征在于,步骤S3中,构建随机森林‑点到面克里金回归具体包括:模型公式表达为:p(vj)=m(vj)+e(vj)其中,m(vj)为网格vj的空间趋势量,e(vj)为网格vj的剩余分量,p(vj)为预测值。2CN112487126A说明书1/4页基于随机森林‑点到面克里金回归的多源数据人口空间化方法技术领域[0001]本发明属于互联网与计算机技术领域,涉及一种基于随机森林‑点到面克里金回归的多源数据人口空间化方法。背景技术[0002]人口空间分布是指一定时间点上人口在地域上的分布状况,是人口过程在空间上的表现形式,是人口地理学研究的核心问题,是人地关系研究的重要基础。关于人口的数据资料一般是人口统计数据,描述每个确定的统计单位(例如行政单位、邮政编码区和人口普查区)内的人口数量、结构和其他资料。人口普查数据是人口统计数据的主要来源,在地球科学应用中具有一定的局限性。首先,人口普查数据仅为每个普查单位提供一个人口计数值;因此,它不能明确每个人口普查单元内的空间人口分布,也不能反映人口内部的变化。此外,普查数据的单位有时与社会经济变量的单位不一致,与自然变量的区域系统(如遥感图像的层)不一致,由于缺乏明确和详细的地理参考,将人口统计数据与地理参考的环境数据结合起来是困难的。因此,对人口统计数据进行空间化是一个十分重要的任务。[0003]在过去的几十年里,人们发展了各种各样的方法来将不规则行政单元的人口普查数据降尺度到精细尺度上的网格化人口分布图。最早主要是基于数学函数的负指数模型和简单的面积加权方法。由于这些模型没有考虑空间人口分布的影响,随后提出了空间插值法,其中具有代表性的是面插值法、点插值法和地统计方法。后来随着技术的更新,越来越多的辅助数据加入模型,分区密度思想(DasymetricMapping)被发展来结合辅助数据来改进网格化人口地图的细节,赖特(Wright)(1936)使用美国地质勘探局地形图,估计不同居民点类型人口密度,首次将分区密度制图技术引入人口空间分布特征研究;著名的WorldPop人口分布项目开发了一种基于随机森林回归半自动Dasymetric方法生成网格人口地图