预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共17页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113869027A(43)申请公布日2021.12.31(21)申请号202110990097.5(22)申请日2021.08.26(71)申请人盐城金堤科技有限公司地址224000江苏省盐城市盐南高新区科城街道学海路大数据产业园B-17-1幢501-503室(72)发明人李凯(74)专利代理机构北京工信联合知识产权代理有限公司11266代理人刘爱丽(51)Int.Cl.G06F40/205(2020.01)G06F16/387(2019.01)权利要求书2页说明书12页附图2页(54)发明名称用于获取文本信息的方法及装置(57)摘要本发明实施例公开了一种用于获取文本信息的方法及装置、计算机可读存储介质和一种电子设备,其特征在于,包括:获取待处理文本中的目标信息;基于所述目标信息,确定所述目标信息的文本位置信息;基于所述待处理文本和所述文本位置信息,获取与所述目标信息对应的至少一种关联信息。本发明实施例为用户抽取招投标信息及其关联信息提供了便利,减少了用户抽取信息的时间成本,降低了用户对于招投标数据的阅读成本。CN113869027ACN113869027A权利要求书1/2页1.一种用于获取文本信息的方法,其特征在于,包括:获取待处理文本中的目标信息;基于所述目标信息,确定所述目标信息的文本位置信息;基于所述待处理文本和所述文本位置信息,获取与所述目标信息对应的至少一种关联信息。2.根据权利要求1所述的方法,其特征在于,所述基于所述待处理文本和所述文本位置信息,获取与所述目标信息对应的至少一种关联信息,包括:基于所述文本位置信息确定第一预设范围内的第一目标文本,并基于所述第一目标文本获取与所述目标信息对应的标识关联信息;基于所述文本位置信息确定第二预设范围内的第二目标文本,并基于所述第二目标文本获取与所述目标信息对应的类型关联信息。3.根据权利要求2所述的方法,其特征在于,通过第二预设规则对第二预设范围内的第二目标文本进行信息挖掘以获取与所述目标信息对应的类型关联信息。4.根据权利要求3所述的方法,其特征在于,当通过所述第二预设规则无法获取所述第二预设范围内的第二目标文本中的与所述目标信息对应的类型关联信息时,通过第一识别模型对第二预设范围内的第二目标文本进行信息挖掘以获取与所述目标信息对应的类型关联信息。5.根据权利要求4所述的方法,其特征在于,还包括:建立基准数据集,所述基准数据集包括多个数据组,其中每个所述数据组包括:所述第二目标文本、所述目标信息和与所述目标信息对应的类型关联信息;基于所述基准数据集对所述第一识别模型进行训练,获取经过训练后的所述第一识别模型。6.根据权利要求5所述的方法,其特征在于,还包括:将多个所述第二目标文本和多个所述目标信息作为所述第一识别模型的输入数据,通过所述第一识别模型对所述输入数据进行分类,并输出分类后的类型关联信息。7.根据权利要求1所述的方法,其特征在于,所述基于所述待处理文本和所述文本位置信息,获取与所述目标信息对应的至少一种关联信息,包括:基于所述文本位置信息从所述待处理文本中抽取待分析文本,所述待分析文本包括所述目标信息;基于所述待分析文本,利用预先训练得到的第二识别模型,预测所述目标信息对应的至少一种关联信息。8.根据权利要求2所述的方法,其特征在于,所述第一预设范围为所述文本位置信息前或后的第一预设长度个字符;和/或,所述第二预设范围为所述文本位置信息前或后的第二预设长度个字符。9.根据权利要求1所述的方法,其特征在于,通过命名实体识别模型对第一预设范围内的第一目标文本进行信息挖掘,获取至少一个标识关联信息。10.根据权利要求9所述的方法,其特征在于,将距离所述目标信息最近的标识关联信息确定为与目标信息对应的标识关联信息。11.一种用于获取文本信息的装置,其特征在于,包括:2CN113869027A权利要求书2/2页获取单元,用于获取待处理文本中的目标信息;确定单元,用于基于所述目标信息,确定所述目标信息的文本位置信息;结果单元,用于基于所述待处理文本和所述文本位置信息,获取与所述目标信息对应的至少一种关联信息。12.一种电子设备,其特征在于,所述电子设备包括:处理器;用于存储所述处理器可执行指令的存储器;所述处理器,用于从所述存储器中读取所述可执行指令,并执行所述指令以实现上述权利要求1‑10任一项所述的方法。13.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序用于执行上述权利要求1‑10任一项所述的方法。14.一种计算机程序,包括计算机可读代码,其特征在于,当所述计算机可读代码在设备上运行时,所述设备中的处理器执行用于实现权利要求1‑10中任一项所