预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共28页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113673528A(43)申请公布日2021.11.19(21)申请号202110902261.2(22)申请日2021.08.06(71)申请人OPPO广东移动通信有限公司地址523860广东省东莞市长安镇乌沙海滨路18号(72)发明人王慧董怀琴尹康朱志鹏(74)专利代理机构深圳市智圈知识产权代理事务所(普通合伙)44351代理人吕静(51)Int.Cl.G06K9/34(2006.01)G06K9/00(2006.01)G06N3/08(2006.01)权利要求书2页说明书16页附图9页(54)发明名称文本处理方法、装置、电子设备和可读存储介质(57)摘要本申请公开了一种文本处理方法、装置、电子设备和可读存储介质,属于图像处理技术领域。该方法包括:获取待处理图像,并对所述待处理图像进行文本识别,得到文本识别结果,所述文本识别结果包括待处理图像中关键词的位置信息;基于所述关键词的位置信息获取所述待处理图像中目标对象的位置信息,所述目标对象与所述关键词对应;根据所述待处理图像中目标对象的位置信息确定目标文本内容,并输出所述目标文本内容。本申请通过利用关键词的位置信息来获取目标对象的位置信息可以提高文本提取的准确性。CN113673528ACN113673528A权利要求书1/2页1.一种文本处理方法,其特征在于,所述方法包括:获取待处理图像,并对所述待处理图像进行文本识别,得到文本识别结果,所述文本识别结果包括待处理图像中关键词的位置信息;基于所述关键词的位置信息获取所述待处理图像中目标对象的位置信息,所述目标对象与所述关键词对应;根据所述待处理图像中目标对象的位置信息确定目标文本内容,并输出所述目标文本内容。2.根据权利要求1所述的方法,其特征在于,所述基于所述关键词的位置信息获取所述待处理图像中目标对象的位置信息,包括:基于所述关键词的位置信息获取与所述关键词相邻的第一区域信息,根据所述第一区域信息获取所述目标对象的位置信息。3.根据权利要求2所述的方法,其特征在于,所述文本识别结果还包括多个候选区域信息,所述根据所述第一区域信息获取所述目标对象的位置信息,包括:对所述文本识别结果进行版面分析操作,得到版面分析结果,所述版面分析操作用于为所述多个候选区域信息分配不同的段落标识;从所述多个段落标识中选出段落标识相同的候选区域信息,并将所述段落标识相同的候选区域信息进行合并,得到第二区域信息;根据所述第一区域信息和所述第二区域信息获取所述目标对象的位置信息。4.根据权利要求3所述的方法,其特征在于,所述根据所述第一区域信息和所述第二区域信息获取所述目标对象的位置信息,包括:确定所述第一区域信息与所述第二区域信息是否匹配;若所述第一区域信息与所述第二区域信息匹配,则根据所述第一区域信息和所述第二区域信息获取所述目标对象的位置信息。5.根据权利要求4所述的方法,其特征在于,所述方法还包括:若所述第一区域信息与所述第二区域信息不匹配,则根据所述第一区域信息获取所述目标对象的位置信息。6.根据权利要求3所述的方法,其特征在于,所述基于所述关键词的位置信息获取与所述关键词相邻的第一区域信息,包括:确定所述待处理图像中的所述关键词是否符合指定条件,所述指定条件用于确定所述关键词是否为完整关键词;若所述待处理图像中的所述关键词符合指定条件,则基于所述关键词的位置信息获取与所述关键词相邻的第一区域信息。7.根据权利要求6所述的方法,其特征在于,所述方法还包括:若所述待处理图像中的所述关键词不符合指定条件,则根据所述第二区域信息获取所述目标对象的位置信息。8.根据权利要求1所述的方法,其特征在于,所述根据所述待处理图像中目标对象的位置信息确定目标文本内容,并输出所述目标文本内容,包括:根据所述关键词的位置信息确定所述关键词对应的参考文本内容,以及根据所述目标对象的位置信息确定所述目标对象对应的目标文本内容;2CN113673528A权利要求书2/2页将所述参考文本内容与所述目标文本内容进行合并,得到候选文本内容;确定所述候选文本内容包括的候选字符串,并对所述候选字符串执行倒序排列操作,得到倒序字符串;若所述倒序字符串符合预设条件,则输出所述目标文本内容。9.根据权利要求8所述的方法,其特征在于,所述若所述倒序字符串符合预设条件,则输出所述目标文本内容,包括:利用正则匹配表达式从所述倒序字符串中查找第一字符串;基于所述第一字符串确定预设数量的第二字符串;获取所述第二字符串与预设字符串之间的匹配度;若所述匹配度大于预设匹配度,则输出所述目标文本内容。10.根据权利要求9所述的方法,其特征在于,所述若所述匹配度大于预设匹配度,则输出所述目标文本内容,包括:获取所述第二字符