预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共25页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN114266252A(43)申请公布日2022.04.01(21)申请号202111372460.3G06N3/06(2006.01)(22)申请日2021.11.18G06N3/08(2006.01)(71)申请人青岛海尔科技有限公司地址266101山东省青岛市崂山区海尔路1号海尔工业园申请人海尔智家股份有限公司(72)发明人刘建国王迪彭强(74)专利代理机构北京同立钧成知识产权代理有限公司11205代理人宋兴臧建明(51)Int.Cl.G06F40/295(2020.01)G06F40/242(2020.01)G06K9/62(2022.01)G06N3/04(2006.01)权利要求书3页说明书16页附图5页(54)发明名称命名实体识别方法、装置、设备及存储介质(57)摘要本申请属于计算机技术领域,具体涉及一种命名实体识别方法、装置、设备及存储介质,用以提高命名实体识别的效率。该命名实体识别方法包括:获取待进行命名实体识别的目标文本,获取目标文本对应的词嵌入向量序列;将词嵌入向量序列输入命名实体识别模型,得到命名实体识别模型的输出为目标文本中命名实体对应的目标类别标签序列,命名实体识别模型用于并行提取词嵌入向量序列包含的各词嵌入向量对应的目标特征向量,以及并行对目标特征向量进行分类处理;根据目标类别标签序列,得到目标文本的命名实体识别结果。本申请能够大大提高命名实体识别的效率。CN114266252ACN114266252A权利要求书1/3页1.一种命名实体识别方法,其特征在于,包括:获取待进行命名实体识别的目标文本;获取所述目标文本对应的词嵌入向量序列;将所述词嵌入向量序列输入命名实体识别模型,得到所述命名实体识别模型的输出为所述目标文本中命名实体对应的目标类别标签序列,所述命名实体识别模型用于并行提取词嵌入向量序列包含的各词嵌入向量对应的目标特征向量,以及并行对所述目标特征向量进行分类处理;根据所述目标类别标签序列,得到所述目标文本的命名实体识别结果。2.根据权利要求1所述的命名实体识别方法,其特征在于,所述命名实体识别模型包括:全连接层和分类处理层,所述将所述词嵌入向量序列输入命名实体识别模型,得到所述命名实体识别模型的输出为所述目标文本中命名实体对应的目标类别标签序列,包括:将所述词嵌入向量序列经过所述全连接层,并行提取所述词嵌入向量序列包含的各词嵌入向量对应的目标特征向量;将所述目标特征向量经过所述分类处理层,并行对所述目标特征向量进行分类处理,得到所述目标文本中命名实体对应的目标类别标签序列。3.根据权利要求1所述的命名实体识别方法,其特征在于,所述获取所述目标文本对应的词嵌入向量序列,包括:通过包含预设注意力机制层数的RoBERTa模型获取所述目标文本对应的词嵌入向量序列,所述RoBERTa模型用于通过预设词典将目标文本中包含的文字转化为对应的数值序列,以及根据所述数值序列和预训练词向量获取所述目标文本对应的词嵌入向量序列。4.根据权利要求1至3中任一项所述的命名实体识别方法,其特征在于,所述根据所述目标类别标签序列,得到所述目标文本的命名实体识别结果,包括:根据预设类别标签格式,对所述目标类别标签序列进行整合处理,获得整合处理后的各目标类别标签;提取所述目标文本中与所述整合处理后的各目标类别标签位置对应的文本,得到所述目标文本的命名实体识别结果。5.根据权利要求1至3中任一项所述的命名实体识别方法,其特征在于,所述命名实体识别模型是通过以下方式获取的:获取训练集,所述训练集包含多个样本对,所述样本对中包含样本文本和所述样本文本对应的标注类别标签序列,所述类别标签用于标识文本包含的命名实体;通过所述训练集对命名实体识别模型进行训练,获取所述样本文本对应的词嵌入向量序列,并行提取所述词嵌入向量序列包含的各词嵌入向量对应的目标特征向量,以及并行对所述目标特征向量进行分类处理,得到所述样本文本中命名实体对应的目标类别标签序列,获取所述目标类别标签序列相对于所述标注类别标签序列的损失函数值;根据所述损失函数值,调整所述命名实体识别模型的参数,得到训练完成的命名实体识别模型。6.根据权利要求5所述的命名实体识别方法,其特征在于,所述并行提取所述词嵌入向量序列包含的各词嵌入向量对应的目标特征向量,包括:针对各所述词嵌入向量,并行执行以下步骤:2CN114266252A权利要求书2/3页将所述词嵌入向量输入至包含第一预设神经元个数的全连接层进行全连接处理,获得对应的第一特征向量;将所述第一特征向量输入至包含第二预设神经元个数的全连接层进行全连接处理,获得对应的第二特征向量;将所述第二特征向量输入至包含第三预设神经元个数的全连接层进行全连接处理,