预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN109272577A(43)申请公布日2019.01.25(21)申请号201811001614.6(22)申请日2018.08.30(71)申请人北京计算机技术及应用研究所地址100854北京市海淀区永定路51号(72)发明人陈宇翔李新乐洪冯韩世杰宋莹(74)专利代理机构中国兵器工业集团公司专利中心11011代理人王雪芬(51)Int.Cl.G06T19/00(2011.01)G06K9/46(2006.01)权利要求书2页说明书6页附图1页(54)发明名称一种基于Kinect的视觉SLAM方法(57)摘要本发明涉及一种基于Kinect的视觉SLAM方法,涉及计算机视觉技术领域。采用本发明基于Kinect的视觉SLAM方法,在视觉里程计环节通过结合主成分分析法将传统的SIFT算法降维得到PCA-SIFT算法,并将匹配时的所用的欧式距离改为街区距离和棋盘距离的线性组合,提高了整体视觉SLAM的实时性。在回环检测中,首先提取关键帧的轮廓进行轮廓匹配缩减所需要进行相似性检测的关键帧数量,然后利用词袋模型进行二次回环精确回环检测,提高了回环检测的鲁棒性。CN109272577ACN109272577A权利要求书1/2页1.一种基于Kinect的视觉SLAM方法,其特征在于,包括以下步骤:在利用摄像机Kinect同时获取物体的彩色图像和深度图像后,执行如下步骤:步骤一,基于PCA-SIFT和线性距离组合的视觉里程计环节在视觉里程计环节采用PCA-SIFT算法,且在特征匹配时用街区距离和棋盘距离的线性组合代替欧式距离,以实时得到关键帧的特征点,进行匹配;步骤二、利用图优化方法减小步骤一的视觉里程计环节中累积的误差;步骤三、基于步骤一的结果,首先提取关键帧的轮廓进行轮廓匹配缩减所需要进行相似性检测的关键帧数量,然后利用词袋模型进行二次回环回环检测。2.如权利要求1所述的方法,其特征在于,步骤一分为以下四个阶段:第一阶段:提取关键帧的SIFT特征首先,构建一个尺度空间;然后利用高斯差分算子DoG计算出关键点;之后求出关键点的主方向;最后生成关键点描述子,作为关键帧的SIFT特征,这个描述子是128维的,关键帧相当于角度转过一定角度或者平移超过一定距离的帧,所述关键点描述子为SIFT描述符;第二阶段:结合主成分分析法得到关键帧的PCA-SIFT特征首先输入待匹配图像的所有SIFT描述符,假设有M个特征点,其特征向量Xi的维数是128维的,i=1,2,3,…,128,构造一个样本矩阵X,其中Xij表示第j个特征点的第i维特征向量的值,0<j≤M;然后计算上述样本矩阵X的协方差矩阵,得到一个128*128的协方差矩阵Z,计算过程如下:先对Xi求平均,得到再对每一个Xi,计算Xi-Xav,这样得到的矩阵记为C=Xi-TXav;得到协方差矩阵Z=C*C;之后计算这个协方差矩阵Z的特征值与对应的特征向量,求出128个特征值和对应的特征向量,然后按照特征值从大到小的顺序排列,取出前T’个较大的特征值对应的特征向量,把其构建成一个128*T’的矩阵,记为S;最后把SIFT描述符投影到子空间中,从而得到PCA-SIFT描述符,作为PCA-SIFT特征;用样本矩阵X乘以特征矩阵S,得到一个M*T’大小的矩阵,将原有的128维SIFT特征降维成T’维向量;第三阶段:用街区距离和棋盘距离的线性组合代替欧氏距离进行对两幅关键帧中的SIFT特征匹配,找到两幅关键帧中的匹配特征点欧式距离为:街区距离D1和棋盘距离D∞的定义为:然后用街区距离D1和棋盘距离D∞的线性组合α(D1(x,y)+D∞(x,y))代替欧氏距离,街区距离和棋盘距离的加减运算;2CN109272577A权利要求书2/2页第四阶段:用RANSAC算法消除误匹配首先对匹配点进行初步筛选,筛选标准是对当前所有匹配点的匹配距离进行排列,找出最小的匹配距离,其他匹配距离如果超过最小匹配距离的4倍,表明这两个点的匹配度相对于其他剩下的点相对较差,则过滤掉这些点,然后采取RANSAC算法对匹配的特征点进行一致性检测。3.如权利要求2所述的方法,其特征在于,T’取20以内的整数。4.如权利要求2所述的方法,其特征在于,第四阶段中,n为偶数时,n为奇数时,5.如权利要求1所述的方法,其特征在于,步骤二具体为:第一步,构建一个求解器globalOptimizer,并写明其使用的算法;然后,在求解器内添加点和边:在所构建的图里,点是关键帧时相机的位姿,边则是相机运动间的变换矩阵,也即这两个点的变换,并在程序运行过程中不断作帧间检测;最后,通过选择一些优化参数完成优化并存储优化结果,优化完毕后读取每个节点的估计值,得到优化后的运动轨迹,其中,选择不