命名实体识别方法、命名实体识别模型的训练方法及装置.pdf
爱欢****23
亲,该文档总共28页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
相关资料
命名实体识别方法、命名实体识别模型的训练方法及装置.pdf
本发明实施例提供了一种命名实体识别方法,方法包括:获取待进行命名实体识别的目标文本;将目标文本输入到预设的命名实体识别模型中,得到目标文本的命名实体识别结果;其中,命名实体识别模型为采用训练样本和训练样本的标注信息训练得到的;命名实体识别模型包括:长短期记忆网络LSTM层;其中,LSTM层对训练样本中除前两个字以外的每一个字的处理过程包括:如果训练样本中该字之前的内容存在词语,对该字的字向量、该字的上一个字的初始特征向量和所存在词语的词向量进行特征提取,得到该字的初始特征向量。与现有技术相比,应用本发明实
命名实体的识别方法和命名实体识别模型的训练方法.pdf
本公开提供了一种命名实体的识别方法和命名实体识别模型的训练方法,涉及人工智能领域,具体涉及自然语言处理和深度学习等技术领域,可应用于知识挖掘和知识图谱构建等场景。命名实体的识别方法的具体实现方案为:根据待识别命名实体的实体类型和待识别文本,获得标记序列;对标记序列进行语义编码,得到实体类型和待识别文本的语义特征;对语义特征进行解码,得到标注矩阵;标注矩阵指示标记序列中的目标标记和语义相邻关系;以及根据标注矩阵,确定待识别文本中属于实体类别的目标命名实体,其中,目标标记为对应目标命名实体的标记;语义相邻关系
命名实体识别模型建立方法及命名实体识别方法.pdf
本公开提供一种命名实体识别模型建立方法,其包括:获取目标领域的训练文本集;基于目标领域的领域特征构建命名实体种类集以及文本段落类别集;基于文本段落类别集以及命名实体种类集构建“文本段落类别‑命名实体种类”映射字典;使用“文本段落类别‑命名实体种类”映射字典对训练文本集中的所有训练文本进行标注,获得每个训练文本的标注序列集,对每个训练文本的标注序列集进行修正,获得修正后的标注序列集;以及至少基于训练文本集的所有训练文本的修正后的标注序列集进行命名实体识别模型训练,获得命名实体识别模型。本公开还提供一种命名实
模型训练、命名实体识别方法及装置.pdf
本说明书实施例提供一种模型训练、命名实体识别方法及装置。在模型训练时,将第一样本序列中的第一命名实体替换为第一预设字符,得到第二样本序列,并从第二样本序列中确定包含第一预设字符的文本片段;采用第一递归神经网络,递归地确定第二样本序列中多个分词的隐向量,并确定文本片段的表征向量;通过变分自编码器,基于表征向量构建高斯分布并确定针对文本片段的全局隐向量;采用第一递归神经网络,以全局隐向量作为初始隐向量,递归地确定文本片段中分词的解码隐向量,并确定文本片段中分词的预测值;基于文本片段中分词与其预测值的差异以及分
模型对抗训练、命名实体识别方法及装置.pdf
本说明书实施例提供一种模型对抗训练、命名实体识别方法及装置。在模型训练中,将第一样本序列中的第一命名实体替换为其对应的原始标签字符,得到第二样本序列,并从第二样本序列中确定包含替换的原始标签字符的第一文本片段,确定第一文本片段的分类标签值为第一值,用于表示已替换命名实体;采用特征提取网络,确定第二样本序列中多个分词的特征隐向量;基于第二样本序列中多个分词的特征隐向量,确定第一文本片段的第一片段向量,将第一片段向量输入第一判别器,得到第一预测值;基于第一预测值与第一值的差异,确定第一损失值;以最小化第一损失