预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共21页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113627395A(43)申请公布日2021.11.09(21)申请号202111096955.8(22)申请日2021.09.17(71)申请人平安银行股份有限公司地址518000广东省深圳市罗湖区深南东路5047号(72)发明人谢勇(74)专利代理机构深圳市隆天联鼎知识产权代理有限公司44232代理人陈涛(51)Int.Cl.G06K9/00(2006.01)G06K9/34(2006.01)G06K9/62(2006.01)G06N3/04(2006.01)G06N3/08(2006.01)权利要求书3页说明书12页附图5页(54)发明名称文本识别方法、装置、介质及电子设备(57)摘要本公开涉及人工智能和图像识别领域,揭示了一种文本识别方法、装置、介质及电子设备。该方法包括:获取待识别图片;对所述待识别图片进行文本检测,得到包含目标文本的文本区域图像;将所述文本区域图像进行分割,得到多个文本子区域图像;利用第一文本识别模型对各个所述文本子区域图像分别进行识别,得到各所述文本子区域图像分别对应的文本识别内容;根据各所述文本子区域图像分别对应的文本识别内容,生成所述待识别图片对应的目标识别结果。此方法下,大大降低了单个识别区域的大小,减少了识别区域中包含的信息量,可以大幅度提升模型识别准确率,提高了模型在识别长文本时的识别效果。此方法可以对医疗领域中的处方笺等文本进行识别。CN113627395ACN113627395A权利要求书1/3页1.一种文本识别方法,其特征在于,所述方法包括:获取待识别图片;对所述待识别图片进行文本检测,得到包含目标文本的文本区域图像;将所述文本区域图像进行分割,得到多个文本子区域图像;利用第一文本识别模型对各个所述文本子区域图像分别进行识别,得到各所述文本子区域图像分别对应的文本识别内容;根据各所述文本子区域图像分别对应的文本识别内容,生成所述待识别图片对应的目标识别结果。2.根据权利要求1所述的方法,其特征在于,在利用第一文本识别模型对各个所述文本子区域图像分别进行识别,得到各所述文本子区域图像分别对应的文本识别内容之前,所述方法还包括:建立样本数据集,其中,所述样本数据集包括多个文本图像和与各文本图像对应的文本内容;利用所述样本数据集进行模型训练,得到第一文本识别模型。3.根据权利要求2所述的方法,其特征在于,所述建立样本数据集,包括:获取第一样本数据子集和多个第二文本图像,其中,所述第一样本数据子集包括多个第一文本图像以及为每一所述第一文本图像对应标注的文本内容;将所述第一文本图像和所述第二文本图像作为系统操作验证码加入系统操作验证码库,随机选择并推送所述系统操作验证码库中的所述系统操作验证码,以获取与所述系统操作验证码对应的校验信息;当获取到与所述第一文本图像对应的校验信息,根据所述第一文本图像对应的文本内容与所述校验信息一致,判断校验通过;当获取到与所述第二文本图像对应的校验信息,直接判断校验通过,并将与所述第二文本图像对应的校验信息作为与所述第二文本图像对应的文本内容;根据所述多个第二文本图像以及与各第二文本图像对应的文本内容,建立第二样本数据子集;对所述第一样本数据子集和所述第二样本数据子集进行集成,得到样本数据集。4.根据权利要求3所述的方法,其特征在于,所述将所述第一文本图像和所述第二文本图像作为系统操作验证码加入系统操作验证码库,随机选择并推送所述系统操作验证码库中的所述系统操作验证码,以获取与所述系统操作验证码对应的校验信息,包括:将所述第一文本图像和所述第二文本图像作为系统操作验证码加入系统操作验证码库;确定每次要推送的系统操作验证码的类型,其中,所述类型包括所述第一文本图像和所述第二文本图像中的一种;随机选择并推送所述系统操作验证码库中的所述类型对应的系统操作验证码,以获取与所述系统操作验证码对应的校验信息。5.根据权利要求4所述的方法,其特征在于,在确定每次要推送的系统操作验证码的类型之前,所述方法还包括:在目标用户首次请求获取验证码之后,持续随机选择并向所述目标用户推送所述系统2CN113627395A权利要求书2/3页操作验证码库中的所述第一文本图像,以向所述目标用户推送多个所述第一文本图像;判断验证码推送方式切换条件是否成立,其中,在验证码推送方式切换条件成立的情况下,执行所述确定每次要推送的系统操作验证码的类型及之后的步骤,所述验证码推送方式切换条件为:当前时间之前所述目标用户提交的连续预定数目个所述第一文本图像对应的校验信息是否均校验通过。6.根据权利要求2所述的方法,其特征在于,所述建立样本数据集,包括:获取第三样本数据子集和多个第四文本图像,其中,所述第三样本数据子集包括多个第