预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共17页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113656629A(43)申请公布日2021.11.16(21)申请号202110865673.3(22)申请日2021.07.29(71)申请人北京百度网讯科技有限公司地址100085北京市海淀区上地十街10号百度大厦2层(72)发明人张晋川(74)专利代理机构北京清亦华知识产权代理事务所(普通合伙)11201代理人张梦瑶(51)Int.Cl.G06F16/583(2019.01)G06K9/34(2006.01)权利要求书2页说明书11页附图3页(54)发明名称视觉定位方法、装置、电子设备及存储介质(57)摘要本公开提供了一种视觉定位方法、装置、电子设备及存储介质,涉及计算机技术领域,具体涉及图像处理、计算机视觉和深度学习等人工智能技术领域。具体实现方案为:获取室内图像;对室内图像进行识别以获取室内图像的第一光学字符识别OCR信息,其中,第一OCR信息包括文本框内的文本信息和文本框内的图像特征点信息;以文本信息为索引从图像数据库之中进行查询,以获取至少一个候选图像的第一图像信息;根据图像特征点信息从至少一个候选图像的第一图像信息中获取目标图像的第二图像信息;以及根据第二图像信息和图像特征点信息确定室内图像的目标位置信息。由此,可以实现利用室内图像的OCR信息进行定位。CN113656629ACN113656629A权利要求书1/2页1.一种视觉定位方法,包括:获取室内图像;对所述室内图像进行识别以获取所述室内图像的第一光学字符识别OCR信息,其中,所述第一OCR信息包括文本框内的文本信息和所述文本框内的图像特征点信息;以所述文本信息为索引从图像数据库之中进行查询,以获取至少一个候选图像的第一图像信息;根据所述图像特征点信息从所述至少一个候选图像的第一图像信息中获取目标图像的第二图像信息;以及根据所述第二图像信息和所述图像特征点信息确定所述室内图像的目标位置信息。2.根据权利要求1所述的方法,其中,所述对所述室内图像进行识别以获取所述室内图像的第一光学字符识别OCR信息,包括:获取图像识别模型;将所述室内图像输入至所述图像识别模型;通过所述图像识别模型对所述室内图像进行识别,以生成所述第一OCR信息。3.根据权利要求1所述的方法,其中,所述图像特征点信息包括图像特征点位置信息和图像特征点特征向量,所述第二图像信息包括所述目标图像的第二OCR信息,所述根据所述图像特征点信息从所述至少一个候选图像的第一图像信息中获取目标图像的第二图像信息,包括:将所述图像特征点特征向量分别与所述至少一个候选图像中每个所述候选图像对应的图像特征点特征向量进行匹配,以生成匹配结果;根据所述匹配结果从所述至少一个候选图像的第一图像信息中获取所述目标图像的第二图像信息。4.根据权利要求3所述的方法,其中,所述第二图像信息还包括所述目标图像的真实位姿,所述第二OCR信息包括所述文本框的平面参数,所述根据所述第二图像信息和所述图像特征点信息确定所述室内图像的目标位置信息,包括:根据所述真实位姿和所述平面参数,生成所述文本框内的图像特征点3D位置信息;根据所述图像特征点3D位置信息和所述图像特征点位置信息,生成所述目标位置信息。5.根据权利要求1所述的方法,其中,所述目标图像为多个,所述根据所述第二图像信息和所述图像特征点信息确定所述室内图像的目标位置信息,包括:分别根据多个所述目标图像的第二图像信息和所述图像特征点信息确定所述室内图像的多个初始位置信息;对所述多个初始位置信息进行全变量优化,以生成所述目标位置信息。6.一种视觉定位装置,包括:第一获取模块,用于获取室内图像;识别模块,用于对所述室内图像进行识别以获取所述室内图像的第一光学字符识别OCR信息,其中,所述第一OCR信息包括文本框内的文本信息和所述文本框内的图像特征点信息;第二获取模块,用于以所述文本信息为索引从图像数据库之中进行查询,以获取至少2CN113656629A权利要求书2/2页一个候选图像的第一图像信息;第三获取模块,用于根据所述图像特征点信息从所述至少一个候选图像的第一图像信息中获取目标图像的第二图像信息;以及确定模块,用于根据所述第二图像信息和所述图像特征点信息确定所述室内图像的目标位置信息。7.根据权利要求6所述的装置,其中,所述识别模块,具体用于:获取图像识别模型;将所述室内图像输入至所述图像识别模型;通过所述图像识别模型对所述室内图像进行识别,以生成所述第一OCR信息。8.根据权利要求6所述的装置,其中,所述图像特征点信息包括图像特征点位置信息和图像特征点特征向量,所述第二图像信息包括所述目标图像的第二OCR信息,所述第三获取模块,具体用于:将所述图像特征点特征向量分别与所述至少一个候选图像中每个