预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共11页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN114154504A(43)申请公布日2022.03.08(21)申请号202111472663.X(22)申请日2021.12.06(71)申请人重庆邮电大学地址400065重庆市南岸区崇文路2号(72)发明人黄胜廖星(51)Int.Cl.G06F40/295(2020.01)G06N3/04(2006.01)G06N3/08(2006.01)权利要求书2页说明书5页附图3页(54)发明名称神经网络模型来解决中文命名实体识别中因为一种基于多信息增强的中文命名实体识别嵌套实体导致的的命名实体识别错误的问题。算法(57)摘要目前,基于字符信息与词信息相结合的中文命名实体识别方法取得了不错的效果,在此基础上,也有采用字形信息进行信息增强的方法,在性能上取得了一定的提高。然而,输入语义信息的欠缺以及嵌套实体导致的实体识别错误的问题还未解决。针对存在的这些问题,本文提出了MIEM(Multi‑InformationEnhancementMethod)模型。MIEM首先通过在嵌入层加入词性信息来增强输入特征,在位置信息编码加入基于二叉树结构编码的嵌套实体位置信息矩阵,然后利用自注意力机制对嵌入信息进行编码,此外,还设计了MD层(moredetailslayer)替代传统的残差结构扩大模型的视野以此来获取更多的信息。这样的设计既增强了输入信息的表达,又增强了实体边界信息,解决了实体边界不清晰问题以及嵌套实体影响实体识别准确率的问题。最CN114154504A后构建了基于嵌入信息及位置编码信息增强的CN114154504A权利要求书1/2页1.一种基于多信息增强的中文命名实体识别方法,其特征在于,能够对文本内容进行处理,得到需要的专有名词,具体包括以下步骤:步骤1、采集用户需要识别的文本语句,通过自然语言处理工具spaCy为输入词添加词性标注,然后将对于词的词性信息转移到字符级别,将字符、词以及词性信息融合作为嵌入信息;步骤2、构建一个基于多信息增强的中文命名实体识别网络,主要包括词性信息嵌入模块、嵌套实体矩阵的位置信息编码模块以及基于细节捕获层的新型前馈神经网络模块;步骤3、在训练完成后的神经网络上对输入语句进行命名实体识别,得到需要的实体类型。2.根据权利要求1所述的一种基于多信息增强的中文命名实体识别方法,其特征在于,所构建的一种基于多信息增强的中文命名实体识别方法网络包括信息嵌入模块、基于嵌套实体矩阵位置信息的自注意力机制模块、新型前馈神经网络模块以及CRF标签约束模块,其中,信息嵌入模块通过匹配预训练好的词表得到字符与词的嵌入向量表示,然后加上词性标注信息并将词性信息转移到字符级别表达,对于未登录词(OutOfVocabulary),这里对其进行随机初始化;自注意力机制模块通过将嵌入信息以及基于嵌套实体矩阵的位置信息送入自注意力机制中得到最后的特征输入,其中位置信息增强部分采用了本发明提出的基于二叉树结构的嵌入实体位置信息编码与FLAT网络的位置信息编码相融合;对于前馈神经网络模块部分,利用本发明提出的细节层(MoreDetailsLayer)来替代普通的残差层捕获更深层次的特征信息,对自注意力机制得到的特征进行再学习;CRF(ConditionalRandomField)标签约束模块对标注序列内部的依赖或者约束进行建模,学习到了标签间的联系信息,最后输出预测结果。3.根据权利要求2所述的一种基于多信息增强的中文命名实体识别方法,其特征在于,模型在嵌入层具有词性信息,在嵌入层通过spaCy为模型加入词性信息,并将词性信息转移到字符,在嵌入层将词性信息很好的与字符信息和词信息进行融合,为网络模型提供了更加丰富的特征。4.根据权利要求2所述的一种基于多信息增强的中文命名实体识别方法,其特征在于,自注意力机制模块(Multi‑HeadAttention)通过多头注意力机制对嵌入信息进行编码,学习到输入词元间的长短距离的依赖,注意力机制的计算方法为:Att(A,V)=softmax(A)V其中,i表示第i个词元,ij表示第i个词元和第j个词元的关系。Q、K、V为输入矩阵的不同线性变换,u、v为可学习的超参数,注意力机制中的位置信息编码模块RBinary和RFLAT是注意力机制中的位置信息编码,用于输入语句中词元之间的位置信息建模,完整的位置信息编码通过拼接RBinary和RFLAT表示为:5.根据权利要求2所述的一种基于多信息增强的中文命名实体识别方法,其特征在于,前馈神经网络模块通过利用线性层对于自注意力机制的输出进行特征映射,其中本发明提出的细节层(MoreDetailsLayer)替代了普通的残差结构,获得更加细节的特征信息。2CN114154504A权利