一种用于命名实体识别的方法与装置.pdf
猫巷****晓容
亲,该文档总共21页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
相关资料
一种用于命名实体识别的方法与装置.pdf
本发明的目的是提供一种命名实体识别方法与装置。通过经训练好的命名实体识别模型对检测文本进行命名实体识别,根据首次输出的识别结果维护对应所述检测文本的词表,所述词表包括已识别的命名实体及其属性信息;将由所述词表生成的输入词向量与所述检测文本再次输入所述命名实体识别模型,以获得新一轮的识别结果并更新所述词表,经过多轮循环直至当前识别的命名实体与上一轮识别的命名实体一致;根据最后一轮的识别结果,确定所述检测文本中的命名实体。由于引入了动态词表,本发明可以在NER检测过程中不断地扩充检测文本的词表,从而提高了词表
一种命名实体识别的方法和装置.pdf
本申请提供一种命名实体识别的方法和装置,所述方法包括:接收原始文本,分离所述原始文本获取文本单元;根据所述文本单元确定文本单元表示向量;获取所述文本单元对应的拆分特征,根据所述文本单元的拆分特征确定所述原始文本的特征表示向量;根据所述原始文本的特征表示向量和所述文本单元表示向量确定所述原始文本中的命名实体。以文本单元对应的拆分特征作为最小元素进行处理,这样可以最大程度保留文本单元作为象形字或形声字的内在特征,保留文本单元间内在的特征,提高命名实体识别的准确度。
一种命名实体的识别方法及装置.pdf
本发明公开了一种命名实体的识别方法及装置,涉及自然语言处理技术领域,主要目的在于提升命名实体识别时的效率。本发明主要的技术方案为:获取目标用户输入的语句;基于预设规则分割所述目标用户输入的语句,得到第一语句以及第二语句;判断所述第一语句中是否存在待识别命名实体的类别;若存在,则从第二语句中识别对应所述类别的命名实体。本发明用于命名实体的识别。
一种基于命名实体识别的中标数据提取方法.pdf
本发明公开了一种基于命名实体识别的中标数据提取方法,从中标公告网页的HTML解析成文本,到文本中提取所需的关键信息,再到提取结果校对,最后校对结果再反哺到提取上,形成一个闭环流程;在提取信息中结合了命名实体识别与规则筛选,提高中标机构的提取率,且针对不同的数据源,所需的改动较少;该方法在把难以处理的表格数据转为易于识别的普通文本数据的同时,尽可能保留了与信息提取相关的各个单元格间的关系,这是后续中标机构、中标标的与中标金额得以高准确率提取的主要因素。该方法可操作性强,随着处理过的数据量的增长,最终会得到较
命名实体识别方法、命名实体识别模型的训练方法及装置.pdf
本发明实施例提供了一种命名实体识别方法,方法包括:获取待进行命名实体识别的目标文本;将目标文本输入到预设的命名实体识别模型中,得到目标文本的命名实体识别结果;其中,命名实体识别模型为采用训练样本和训练样本的标注信息训练得到的;命名实体识别模型包括:长短期记忆网络LSTM层;其中,LSTM层对训练样本中除前两个字以外的每一个字的处理过程包括:如果训练样本中该字之前的内容存在词语,对该字的字向量、该字的上一个字的初始特征向量和所存在词语的词向量进行特征提取,得到该字的初始特征向量。与现有技术相比,应用本发明实