预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共17页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN114120344A(43)申请公布日2022.03.01(21)申请号202111477893.5(22)申请日2021.12.06(71)申请人上海数禾信息科技有限公司地址201206上海市浦东新区自由贸易试验区金科路2889弄1号2层201室(72)发明人董雅洁(74)专利代理机构北京市万慧达律师事务所11111代理人刘锋邱忠贶(51)Int.Cl.G06V30/412(2022.01)G06V30/19(2022.01)G06K9/62(2022.01)权利要求书2页说明书10页附图4页(54)发明名称文本确定方法、装置、计算机设备和存储介质(57)摘要本申请涉及一种文本确定方法、装置、计算机设备和存储介质。文本确定方法包括:获取目标图片;确定目标图片上各文本的文本框位置;根据各文本框位置与参考位置的距离,确定目标图片上的目标文本框;将目标文本框的文本确定为目标文本。采用方法,不需要在每次获取目标图片后,设置人工筛选规则,且不会发生因为人工筛选规则的关键词局限而导致无法获取全面、完整的目标文本的情况。另外,本申请提供的方法,无需人工对目标图片提取出来的文本进行处理,节省了人力和时间,提升了确定目标文本的速度。CN114120344ACN114120344A权利要求书1/2页1.一种文本确定方法,其特征在于,所述方法包括:获取目标图片;确定所述目标图片上各文本的文本框位置;根据各所述文本框位置与参考位置的距离,确定所述目标图片上的目标文本框;将所述目标文本框的文本确定为目标文本。2.根据权利要求1所述的方法,其特征在于,所述根据各所述文本框位置与参考位置的距离,确定所述目标图片上的目标文本框,包括:根据各所述文本框位置,确定各文本框的重心;根据各所述文本框的重心与参考位置的距离,确定所述目标文本框。3.根据权利要求2所述的方法,其特征在于,所述根据各所述文本框的重心与参考位置的距离,确定所述目标文本框,包括:在各所述文本框的重心中,确定与所述参考位置的距离最小的文本框的重心;将与所述参考位置的距离最小的文本框的重心所对应的文本框确定为所述目标文本框。4.根据权利要求2所述的方法,其特征在于,各所述文本框位置包括各所述文本框的顶点坐标;所述根据各所述文本框位置,确定各文本框的重心,包括:根据各所述文本框的顶点坐标,确定各所述文本框的重心。5.根据权利要求1所述的方法,其特征在于,所述根据各所述文本框位置与参考位置的距离,确定所述目标图片上的目标文本框,包括:根据各所述文本框位置与参考位置的距离,确定所述目标图片上具有预设文本类型的目标文本框。6.根据权利要求1所述的方法,其特征在于,所述方法还包括:确定与所述目标图片具有相同页面类型的标准图片,获取所述标准图片上指定文本框的位置作为所述参考位置;或确定所述目标图片的页面类型,根据预设的页面类型与参考位置的关系,确定与所述目标图片的页面类型对应的参考位置。7.根据权利要求1所述的方法,其特征在于,所述确定所述目标图片上各文本的文本框位置,包括:对所述目标图片进行光学字符识别,获得所述目标图片上的多个文本的文本框;确定所述目标图片上的原点;根据各所述文本的文本框与所述原点的距离确定各所述文本框位置。8.一种文本确定装置,其特征在于,所述装置包括:图片获取模块,用于获取目标图片;文本框位置确定模块,用于确定所述目标图片上各文本的文本框位置;目标文本框确定模块,用于根据各所述文本框位置与参考位置的距离,确定所述目标图片上的目标文本框;目标文本确定模块,用于将所述目标文本框的文本确定为目标文本。9.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计2CN114120344A权利要求书2/2页算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述方法的步骤。3CN114120344A说明书1/10页文本确定方法、装置、计算机设备和存储介质技术领域[0001]本申请涉及文本提取技术领域,特别是涉及一种文本确定方法、装置、计算机设备和存储介质。背景技术[0002]从图片中提取出所需的文本,以进行后续的信息录入或分析,在金融行业的应用越来越广泛。例如,在金融行业的反欺诈行为的判断应用中,可以将客户上传的图片利用OCR(OpticalCharacterRecognition,光学字符识别)技术识别出文本,将识别出的文本与已有的客户信息进行比对,以判断客户欺诈的可能性。[0003]在此过程中,传统技术是先将客户上传的图片中的文本全部识别出