预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共18页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113963355A(43)申请公布日2022.01.21(21)申请号202111575873.1(22)申请日2021.12.22(71)申请人北京亮亮视野科技有限公司地址100015北京市朝阳区酒仙桥路10号恒通国际商务园B12C三层301(72)发明人吴斐杨华龙张立张冰洋刘天一(74)专利代理机构北京路浩知识产权代理有限公司11002代理人毛宏宝(51)Int.Cl.G06V30/148(2022.01)G06V30/10(2022.01)G06V40/20(2022.01)权利要求书2页说明书8页附图7页(54)发明名称OCR文字识别方法、装置、电子设备及存储介质(57)摘要本发明提供一种OCR文字识别方法、装置、电子设备及存储介质,其中,OCR文字识别方法包括接收对手势识别的开启操作;响应于所述开启操作,对场景中的手势进行检测,得到目标手势;基于所述目标手势,确定文字所在的图像区域;对所述图像区域中的文字进行识别,得到目标识别文字。采用本方法能够提高OCR文字识别效率。CN113963355ACN113963355A权利要求书1/2页1.一种OCR文字识别方法,其特征在于,包括:接收对手势识别的开启操作;响应于所述开启操作,对场景中的手势进行检测,得到目标手势;基于所述目标手势,确定文字所在的图像区域;对所述图像区域中的文字进行识别,得到目标识别文字。2.根据权利要求1所述的OCR文字识别方法,其特征在于,所述基于所述目标手势,确定文字所在的图像区域包括:在图像坐标系下,确定所述目标手势的图像坐标;根据所述图像坐标,确定所述图像区域。3.根据权利要求2所述的OCR文字识别方法,其特征在于,所述根据所述图像坐标,确定所述图像区域包括:获取所述目标手势中的第一目标图像坐标和第二目标图像坐标,所述第一目标图像坐标为所述目标手势中第一目标关节点的图像坐标,所述第二目标图像坐标为所述目标手势中第二目标关节点的图像坐标;对所述第一目标图像坐标中第一横坐标与所述第二目标图像坐标中第二横坐标进行差值计算,得到第一差值坐标;以及,对所述第一目标图像坐标中第一纵坐标与所述第二目标图像坐标中第二纵坐标进行差值计算,得到第二差值坐标;根据所述第一差值坐标和所述第二差值坐标,确定所述图像区域。4.根据权利要求1所述的OCR文字识别方法,其特征在于,所述对所述图像区域中的文字进行识别,得到目标识别文字之后还包括:将所述目标识别文字展示于目标交互界面上;响应于对所述目标识别文字的触发操作,发送执行指令到目标功能模块,以使所述目标功能模块根据所述执行指令执行对应的功能。5.根据权利要求1所述的OCR文字识别方法,其特征在于,所述基于所述目标手势,确定文字所在的图像区域包括:在所述目标手势为OCR文字识别手势的情况下,开启OCR文字识别功能;在开启OCR文字识别功能的情况下,在预设时间内,确定文字所在的图像区域。6.根据权利要求5所述的OCR文字识别方法,其特征在于,所述在所述目标手势为OCR文字识别手势的情况下,开启OCR文字识别功能之后包括:获取目标图像;以文字所在的行为划分单位,对所述目标图像中的文字进行划分,得到目标子图像集合;所述对所述图像区域中的文字进行识别,得到目标识别文字包括:对所述目标子图像集合中个各个目标子图像进行识别,得到目标识别文字。7.一种OCR文字识别装置,其特征在于,包括:第一处理模块,用于接收对手势识别的开启操作;第二处理模块,用于响应于所述开启操作,对场景中的手势进行检测,得到目标手势;第三处理模块,用于基于所述目标手势,确定文字所在的图像区域;第四处理模块,用于对所述图像区域中的文字进行识别,得到目标识别文字。2CN113963355A权利要求书2/2页8.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至6任一项所述OCR文字识别方法的步骤。9.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述OCR文字识别方法的步骤。3CN113963355A说明书1/8页OCR文字识别方法、装置、电子设备及存储介质技术领域[0001]本发明涉及增强现实技术领域,尤其涉及一种OCR文字识别方法、装置、电子设备及存储介质。背景技术[0002]随着增强现实技术的发展,其广泛应用于医疗、工业维修或娱乐等各个领域。增强现实(AugmentedReality,简称AR),是一种将虚拟信息与真实世界巧妙融合的技术,广泛运用了多媒体、三维建模、实时跟踪及注册、智能交互和传感等多种技术手段,将计算机生成