预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共26页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113920286A(43)申请公布日2022.01.11(21)申请号202010575360.X(22)申请日2020.06.22(71)申请人北京字节跳动网络技术有限公司地址100041北京市石景山区实兴大街30号院3号楼2层B-0035房间(72)发明人不公告发明人(74)专利代理机构上海光栅知识产权代理有限公司31340代理人关浩马雯雯(51)Int.Cl.G06V10/22(2022.01)G06V10/26(2022.01)G06V30/148(2022.01)权利要求书2页说明书14页附图9页(54)发明名称字符定位方法和装置(57)摘要本公开的实施例公开了字符定位方法和装置。该方法的一具体实施方式包括:获取目标图像;对上述目标图像进行文本行检测,得到上述目标图像中的文本行的文本行位置信息;对上述目标图像中位于上述文本行位置信息指示的位置的图像区域进行字符识别,得到上述文本行包括的字符序列;根据上述字符序列,生成上述文本行中的字符的字符位置信息。该实施方式通过文本行检测和字符识别来确定字符的位置,可以提高单字符定位的速度,降低单字符定位的计算量,减少定位过程中对计算资源的消耗。CN113920286ACN113920286A权利要求书1/2页1.一种字符定位方法,包括:获取目标图像;对所述目标图像进行文本行检测,得到所述目标图像中的文本行的文本行位置信息;对所述目标图像中位于所述文本行位置信息指示的位置的图像区域进行字符识别,得到所述文本行包括的字符序列;根据所述字符序列,生成所述文本行中的字符的字符位置信息。2.根据权利要求1所述的方法,其中,所述字符序列包括占位字符和非占位字符;以及所述根据所述字符序列,生成所述文本行中的字符的字符位置信息,包括:根据所述字符序列中的占位字符的占位字符位置信息,生成所述文本行中的各个非占位字符的非占位字符位置信息。3.根据权利要求1所述的方法,其中,所述字符序列包括占位字符和非占位字符;以及所述根据所述字符序列,生成所述文本行中的字符的字符位置信息,包括:根据所述字符序列,生成所述字符序列中的占位字符的字符位置信息和各个非占位字符的字符位置信息;针对所述字符序列中的两相邻占位字符,响应于所述字符序列中该两相邻占位字符之间的各个非占位字符相同,根据该两相邻占位字符之间的各个非占位字符的非占位字符位置信息,生成所述文本行中与该两相邻占位字符之间的非占位字符相对应的字符的字符位置信息。4.根据权利要求1所述的方法,其中,所述文本行位置信息通过四边形框表征,所述字符序列包括占位字符和非占位字符;以及所述根据所述字符序列,生成所述文本行中的字符的字符位置信息,包括:根据所述字符序列,生成所述字符序列中的占位字符的字符位置信息;针对所述字符序列中的两相邻非占位字符,根据该两相邻非占位字符之间的占位字符的占位字符位置信息,确定用于对所述四边框进行分割的分割位置信息;按照所得到的各个分隔位置信息指示的位置对所述四边框进行分割,将分割结果确定为所述文本行中的字符的字符位置信息。5.根据权利要求1所述的方法,其中,所述根据所述字符序列,生成所述文本行中的字符的字符位置信息,包括:根据所述字符序列,生成所述文本行中的字符在所述图像区域中的位置信息;根据所述文本行位置信息和所述字符在所述图像区域中的位置信息,确定字符在所述目标图像中的字符位置信息。6.根据权利要求1-5之一所述的方法,其中,所述获取目标图像,包括:获取目标显示屏呈现的图像作为目标图像;以及所述方法还包括:响应于检测到针对所述目标图像中的字符的用户操作,根据所述用户操作对所述目标显示屏的操作位置和所述文本行中的字符的字符位置信息,从所述文本行位置信息指示的文本行中确定所述用户操作指示的待操作字符。7.根据权利要求6所述的方法,其中,所述方法还包括:输出与所述待操作字符预先关联的输出信息。2CN113920286A权利要求书2/2页8.根据权利要求6所述的方法,其中,所述方法还包括:按照所述用户操作的指示,对所述待操作字符进行所述用户操作指示的处理。9.一种字符定位装置,包括:获取单元,被配置成获取目标图像;检测单元,被配置成对所述目标图像进行文本行检测,得到所述目标图像中的文本行的文本行位置信息;识别单元,被配置成对所述目标图像中位于所述文本行位置信息指示的位置的图像区域进行字符识别,得到所述文本行包括的字符序列;生成单元,被配置成根据所述字符序列,生成所述文本行中的字符的字符位置信息。10.一种电子设备,包括:一个或多个处理器;存储装置,其上存储有一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-8