预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共20页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113722431A(43)申请公布日2021.11.30(21)申请号202110973259.4(22)申请日2021.08.24(71)申请人北京工业大学地址100022北京市朝阳区平乐园100号(72)发明人李建强赵慧凤张硕(74)专利代理机构北京路浩知识产权代理有限公司11002代理人王宇杨(51)Int.Cl.G06F16/33(2019.01)G06F16/36(2019.01)G06F40/295(2020.01)G06K9/62(2006.01)权利要求书3页说明书13页附图3页(54)发明名称命名实体关系识别方法、装置、电子设备及存储介质(57)摘要本发明提供一种命名实体关系识别方法、装置、电子设备及存储介质。所述方法包括:获取目标文本,将所述目标文本输入至命名实体关系识别模型中,得到命名实体关系识别结果;其中,所述命名实体关系识别模型由命名实体关系语言子模型、强化学习代理子模型和对比学习关系增强子模型组成。本发明通过经过对比学习训练的命名实体关系识别模型进行命名实体关系识别,可以有效去除远程监督产生的噪音,降低所收集的命名实体关系结果的不确定性。CN113722431ACN113722431A权利要求书1/3页1.一种命名实体关系识别方法,其特征在于,包括:获取目标文本,将所述目标文本输入至命名实体关系识别模型中,得到命名实体关系识别结果;其中,所述命名实体关系识别模型由命名实体关系语言子模型、强化学习代理子模型和对比学习关系增强子模型组成,所述命名实体关系识别模型基于以下步骤进行训练:步骤1,根据预设知识库的远程监督,构建远程标记命名实体关系数据集;步骤2,将所述远程标记命名实体关系数据集输入至命名实体关系语言子模型中,得到用于表征命名实体关系的词向量;所述命名实体关系语言子模型是指利用所述远程标记命名实体关系数据集和未标记语料库作为输入样本,以及利用表征命名实体关系的词向量作为输出样本,进行训练后得到的;步骤3,对所述词向量对应的命名实体的实体类型分别进行标注后,输入至强化学习代理子模型中,得到包含假阳性命名实体关系实例的远程标记命名实体关系数据集;其中,所述强化学习代理子模型是指利用阳性命名实体关系实例作为正样本,以及利用假阳性命名实体关系实例作为负样本,基于交差熵代价函数进行训练后得到的;步骤4,将包含假阳性命名实体关系实例的远程标记命名实体关系数据集输入至对比学习关系增强子模型中,得到命名实体关系增强的词向量;其中,所述命名实体关系增强的词向量用于更新所述强化学习代理子模型的状态属性,以增强所述强化学习代理子模型识别假阳性命名实体关系实例的能力;所述对比学习关系增强子模型是指利用强化学习代理子模型输出的假阳性命名实体关系实例作为负样本,以及强化学习代理子模型输出的除假阳性命名实体关系实例外的命名实体关系实例作为正样本,进行训练后得到的;步骤5,将所述强化学习代理子模型输出的远程标记命名实体关系数据集输入至关系分类器,根据关系分类器的当前性能不断优化强化学习代理模型,直至输出去除噪音的远程标记命名实体关系数据集,所述命名实体关系识别模型训练结束。2.根据权利要求1所述的命名实体关系识别方法,其特征在于,所述根据预设知识库的远程监督,构建远程标记命名实体关系数据集,包括:基于标注好的小型知识图谱,对预设知识库中的文本标注命名实体关系标签,构建远程标记命名实体关系数据集。3.根据权利要求1所述的命名实体关系识别方法,其特征在于,所述交差熵代价函数j(θ)为:其中,yi为强化学习代理选择的标签,保留为1,去除为0,a为动作,si为状态。4.根据权利要求1所述的命名实体关系识别方法,其特征在于,所述对比学习关系增强子模型训练的损失函数为:2CN113722431A权利要求书2/3页其中,tA和tB为通过线性采样的元组集,和为元组集,和为正样本的关系表示,Z为正样本与负样本的余弦相似度,N为超参数,为从负样本集中采样的元组。5.根据权利要求1所述的命名实体关系识别方法,其特征在于,所述关系分类器训练的损失函数j(θ)为:其中,Ω为与上次迭代所移除的假阳性命名实体关系实例中不同的部分,a为动作,s为状态,R为强化学习代理子模型的奖励参数。6.一种命名实体关系识别装置,其特征在于,包括:处理模块,用于获取目标文本,将所述目标文本输入至命名实体关系识别模型中,得到命名实体关系识别结果;其中,所述命名实体关系识别模型由命名实体关系语言子模型、强化学习代理子模型和对比学习关系增强子模型组成,所述命名实体关系识别模型基于以下步骤进行训练:根据预设知识库的远程监督,构建远程标记命名实体关系数据集;将所述远程标记命名实体关系数据集输入至命名实体关