预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共12页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN114138927A(43)申请公布日2022.03.04(21)申请号202111477985.3(22)申请日2021.12.06(71)申请人杭州筑龙信息技术股份有限公司地址310000浙江省杭州市滨江区通策广场2幢1001-1室(72)发明人蒋聪焦尧陶治(74)专利代理机构北京超凡宏宇专利代理事务所(特殊普通合伙)11463代理人舒淼(51)Int.Cl.G06F16/31(2019.01)G06F9/451(2018.01)G06F9/54(2006.01)G06N3/08(2006.01)权利要求书2页说明书7页附图2页(54)发明名称文本信息提取方法、装置及电子设备(57)摘要本发明提供了一种文本信息提取方法、装置及电子设备,该方法包括:获取待处理文本;在预设显示界面显示该待处理文本和待提取信息栏;该待提取信息栏包括至少一个待提取字段;如果接收到信息提取指令,通过预先训练好的文本信息提取模型处理该待处理文本,输出该至少一个待提取字段中每个待提取字段对应的目标文本信息。该方法通过预先训练好的文本信息提取模型处理该待处理文本,提升了文本信息提取的智能化程度,从而提升对文本信息提取的效率。CN114138927ACN114138927A权利要求书1/2页1.一种文本信息提取方法,其特征在于,包括:获取待处理文本;在预设显示界面显示所述待处理文本和待提取信息栏;所述待提取信息栏包括至少一个待提取字段;如果接收到信息提取指令,通过预先训练好的文本信息提取模型处理所述待处理文本,输出所述至少一个待提取字段中每个待提取字段对应的目标文本信息。2.根据权利要求1所述的文本信息提取方法,其特征在于,在输出所述至少一个待提取字段中每个待提取字段对应的目标文本信息的步骤之后,所述方法还包括:在所述待提取信息栏显示所述待提取字段和所述待提取字段对应的文本信息。3.根据权利要求1所述的文本信息提取方法,其特征在于,在输出所述至少一个待提取字段中每个待提取字段对应的目标文本信息的步骤之后,所述方法还包括:在所述显示界面显示的所述待处理文本中,将所述目标文本信息进行区别显示。4.根据权利要求1所述的文本信息提取方法,其特征在于,所述文本信息提取模型通过下述方式训练得到:获取预设的训练集数据;所述训练集数据包括:用于训练的文本信息和所述文本信息的提取后的字段信息;根据所述训练集数据训练预设的初始文本信息提取网络,直至满足预设的训练结束条件,得到训练好的文本信息提取模型。5.根据权利要求4所述的文本信息提取方法,其特征在于,所述文本信息提取模型为基于Bert模型搭建的深度学习神经网络模型;所述预设显示界面为基于开放源代码的互联网应用框架搭建的人机交互界面。6.根据权利要求5所述的文本信息提取方法,其特征在于,所述输出所述至少一个待提取字段中每个待提取字段对应的目标文本信息之后,所述方法还包括:基于所述人机交互界面,核查每个待提取字段对应的目标文本信息的准确性;基于核查结果,确定输出每个待提取字段对应的准确的所述目标文本信息。7.根据权利要求6所述的文本信息提取方法,其特征在于,所述方法还包括:将经过核查的每个待提取字段对应的准确的所述目标文本信息输入预设的初始文本信息提取网络,直至满足预设的训练结束条件,得到更新后的所述文本信息提取模型。8.根据权利要求4所述的文本信息提取方法,其特征在于,所述用于训练的文本信息为中标公示公告;所述提取后的字段信息包括:建造师姓名、建造师证书编号、中标企业、中标金额、中标时间、开标时间、发布时间、工期、项目名称、业主、竣工时间、第二中标候选人、第三中标候选人。9.一种文本信息提取装置,其特征在于,包括:文本获取模块,用于获取待处理文本;显示模块,用于在预设显示界面显示所述待处理文本和待提取信息栏;所述待提取信息栏包括至少一个待提取字段;数据处理模块,用于如果接收到信息提取指令,通过预先训练好的文本信息提取模型处理所述待处理文本,输出所述至少一个待提取字段中每个待提取字段对应的目标文本信息。2CN114138927A权利要求书2/2页10.一种电子设备,其特征在于,所述电子设备包括处理器和存储器,所述存储器存储有能够被所述处理器执行的计算机可执行指令,所述处理器执行所述计算机可执行指令以实现权利要求1至8任一项所述的文本信息提取方法。3CN114138927A说明书1/7页文本信息提取方法、装置及电子设备技术领域[0001]本发明涉及数据提取技术领域,尤其是涉及一种文本信息提取方法、装置及电子设备。背景技术[0002]目前,现有的建筑行业在对中标公示公告文本进行信息提取时,首先要运用传统信息采集技术将该中标公示公告的标题以及连接内容进行相