预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共12页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113850270A(43)申请公布日2021.12.28(21)申请号202110422598.3(22)申请日2021.04.15(71)申请人北京大学地址100871北京市海淀区颐和园路5号(72)发明人陈小康唐嘉祥王靖博曾钢(74)专利代理机构北京万象新悦知识产权代理有限公司11360代理人黄凤茹(51)Int.Cl.G06K9/46(2006.01)G06K9/62(2006.01)G06F40/30(2020.01)G06N3/04(2006.01)G06N3/08(2006.01)权利要求书3页说明书6页附图2页(54)发明名称基于点云-体素聚合网络模型的语义场景补全方法及系统(57)摘要本发明公布了一种基于点云‑体素聚合网络模型的语义场景补全方法,建立点云‑体素聚合网络模型作为三维图像语义场景补全深度神经网络模型,包括点云‑体素双路编码器和以语义传播模块为基本单元构成的解码器;点云‑体素双路编码器以点云模型作为主干,使用浅层的三位卷积神经网络作为体素分支,将二维单目深度图像转换为三维点云,提取点云与体素两种数据模态中互补的特征,并对特征进行融合;且保留稠密体素中的局部结构特征;再通过解码器对提取特征逐层上采样,恢复三维场景的几何结构以及语义信息,最终对应到体素中得到三维场景的结构与语义。本发明方法能够高效且准确地完成语义场景补全任务。CN113850270ACN113850270A权利要求书1/3页1.一种基于点云‑体素聚合网络模型的语义场景补全方法,建立点云‑体素聚合网络模型作为三维图像语义场景补全深度神经网络模型,将二维单目深度图像转换为三维点云;提取点云与体素两种数据模态中互补的特征,并对特征进行融合;再使用提取的特征进行预测,得到每个三维点的语义结果,最终对应到体素中得到三维场景的结构与语义;三维图像语义场景补全深度神经网络模型包括点云‑体素双路编码器和以语义传播模块为基本单元构成的解码器;所述点云‑体素双路编码器以点云模型作为主干,同时使用浅层的三位卷积神经网络作为体素分支,用于提取局部结构信息,并对特征进行融合,且保留稠密体素中的局部结构特征;再通过解码器对提取的特征逐层上采样,恢复三维场景的几何结构以及语义信息;所述基于点云‑体素聚合网络模型的语义场景补全方法包括如下步骤:A.通过深度传感器采集二维单目深度图像,根据二维单目深度图像生成三维空间的体素表示;并计算得到三维空间中每一个体素的截断符号距离函数TSDF矩阵以及标准化高度信息;根据TSDF矩阵,提取可见表面以及被遮挡的体素;再转换为点云表示;B.构建三维图像语义场景补全深度神经网络模型的点云‑体素双路编码器;通过点云‑体素双路编码器提取特征;点云‑体素双路编码器包括点云分支和体素分支;使用体素分支对生成的体素表示进行卷积,提取体素特征;使用点云分支对生成的点云表示提取点云特征;再将体素特征融合到点云特征中;C.构建三维图像语义场景补全深度神经网络模型的解码器;包括:C1.将融合的特征逐层上采样,最后输出每一个输入的点云的分类结果,包括场景补全结果和语义分割结果;C2.根据点云与体素的一一对应关系,将点云的预测结果对应到体素的预测结果,从而获得使用体素表示的三维场景结构及其语义分割结果;利用训练好的三维图像语义场景补全深度神经网络模型,即实现基于点云‑体素聚合网络模型的语义场景补全。2.如权利要求1所述基于点云‑体素聚合网络模型的语义场景补全方法,其特征是,步骤A具体包括:A1.通过相机参数,将二维单目深度图像投影到三维空间,并对三维空间按照一定的空间分辨率进行量化,得到以体素的形式表示的三维场景;A2.对体素空间进行进一步编码,计算其中每一个体素的截断符号距离函数TSDF矩阵以及标准化的高度信息;A3.根据TSDF矩阵,提取可见表面以及被遮挡的体素,并转换为点云表示。3.如权利要求1所述基于点云‑体素聚合网络模型的语义场景补全方法,其特征是,在步骤A中,根据输入的深度图数据以及相机参数将二维深度投影到三维空间,得到观测到的表面的位置和被遮挡区域的位置。4.如权利要求3所述基于点云‑体素聚合网络模型的语义场景补全方法,其特征是,在步骤A中,根据TSDF值,将体素空间中的每一个体素进行分类,TSDF为0的位置为可见表面体素,TSDF为正的位置为可见空气体素,TSDF为负的位置为被遮挡的体素;在点云表示中舍弃可见空气体素,只提取可见表面与被遮挡的体素转换为点云分支的输入。2CN113850270A权利要求书2/3页5.如权利要求1所述基于点云‑体素聚合网络模型的语义场景补全方法,其特征是,在步骤B中,通过点云‑体素双路编码器对输入进行特征提取;体素分支具体使用浅层3DC