一种文本基因提取方法、装置及电子设备.pdf
茂学****23
亲,该文档总共21页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
相关资料
一种文本基因提取方法、装置及电子设备.pdf
本发明涉及自然语言处理技术,尤其涉及一种文本基因提取方法、装置及电子设备。其中,该文本基因提取方法包括:构建文本基因词典,根据所述文本基因词典,生成待提取文本的第一候选文本基因集合;根据文本基因提取规则,生成所述待提取文本的第二候选文本基因集合;根据所述第一候选文本基因集合与所述第二候选文本基因集合,生成目标文本基因集合。本发明实施例通过两种方式分别获取两个候选文本基因集合,从而获取待提取文本的目标文本基因集合,丰富了文本基因提取方法,提高了文本基因提取准确率。
一种文本关系提取方法、装置及电子设备.pdf
本说明书实施例提供一种文本关系提取方法、装置及电子设备。所述方法包括:获取一个或多个待处理的目标文本,其中,所述目标文本中包含待提取文本以及待提取文本之间的文本关系;利用预定的规则模板对所述目标文本进行检测,以便从所述目标文本中提取出若干个待提取文本;根据预定的文本相似度模型,将每个所述待提取文本与预设的标准文本库中的各个文本分别进行相似度计算,得到每个所述待提取文本与所述标准文本库中各文本之间对应的相似度值;将相似度值大于指定阈值时的文本作为与之对应的待提取文本的标准文本,并根据所述待提取文本之间的文本
一种文本特征的提取方法、装置和电子设备.pdf
本申请实施例公开了一种文本特征的提取方法、装置和电子设备,该方法包括:获取样本集合和特征词集合,并确定样本集合中每个文本的类别;根据每个文本的类别,确定对应于每个类别的每个特征词的第一参数和第二参数;对于特征词集合中的每个特征词和样本集合中的每个文本,根据第一参数、特征词在文本中出现的次数,以及文本中所有词汇出现的次数的总和,确定第一频率;根据第二参数、文本集合中包含特征词的文本个数,以及文本中所有词汇出现的次数的总和,确定第二频率;根据第一频率和第二频率,确定对应于每个文本的每个特征词的权重,得到每个类
一种提取文本字段的方法、装置及电子设备.pdf
本申请公开一种提取文本字段的方法、装置及电子设备,该方法包括获取包含文本字段的原始图像,并在原始图像中确定出各个目标图像区域,然后对各个目标图像区域中的文本字段进行文本识别,得到各个目标图像区域对应的文本字段,再根据预设提取规则,从文本字段中提取出满足业务需求的目标文本字段。基于上述方法,实现对完税证明图像中的目标文本字段的提取,解决现有技术中无法针对完税证明图像中满足业务需求的目标文本字段进行提取的问题,有效提高提取目标文本字段的准确率。
文本信息提取方法、装置及电子设备.pdf
本发明提供了一种文本信息提取方法、装置及电子设备,该方法包括:获取待处理文本;在预设显示界面显示该待处理文本和待提取信息栏;该待提取信息栏包括至少一个待提取字段;如果接收到信息提取指令,通过预先训练好的文本信息提取模型处理该待处理文本,输出该至少一个待提取字段中每个待提取字段对应的目标文本信息。该方法通过预先训练好的文本信息提取模型处理该待处理文本,提升了文本信息提取的智能化程度,从而提升对文本信息提取的效率。