预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共14页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113723108A(43)申请公布日2021.11.30(21)申请号202110921072.X(22)申请日2021.08.11(71)申请人北京工业大学地址100022北京市朝阳区平乐园100号(72)发明人李建强杨鲤银赵琳娜(74)专利代理机构北京路浩知识产权代理有限公司11002代理人王宇杨(51)Int.Cl.G06F40/30(2020.01)G06F16/33(2019.01)G06N3/02(2006.01)G06N3/08(2006.01)权利要求书2页说明书8页附图3页(54)发明名称一种事件提取方法、装置、电子设备及存储介质(57)摘要本申请实施例公开了一种事件提取方法、装置、电子设备及存储介质。所述方法包括:获取目标文本,将目标文本输入至事件提取模型中,得到事件提取结果;事件提取模型是基于目标文本和目标文本对应的正负样本,通过对比学习的方式进行训练后得到的;目标文本对应的正样本为表达目标文本上下文语义的第一特征向量,目标文本对应的负样本为表达目标文本局部语义的第二特征向量。本申请实施例通过经过对比学习训练的事件提取模型进行文本事件提取,可以减少文本局部语义信息的干扰,提高识别文本事件的准确率。CN113723108ACN113723108A权利要求书1/2页1.一种事件提取方法,其特征在于,包括:获取目标文本,将所述目标文本输入至事件提取模型中,得到事件提取结果;其中,所述事件提取模型是基于所述目标文本和所述目标文本对应的正负样本,通过对比学习的方式进行训练后得到的;所述目标文本对应的正样本为表达所述目标文本上下文语义的第一特征向量,所述目标文本对应的负样本为表达所述目标文本局部语义的第二特征向量。2.根据权利要求1所述的事件提取方法,其特征在于,所述事件提取模型由循环神经网络和卷积神经网络组成;其中,所述循环神经网络用于提取所述目标文本上下文语义的第一特征向量,所述卷积神经网络用于提取所述目标文本局部语义的第二特征向量。3.根据权利要求2所述的事件提取方法,其特征在于,所述事件提取模型基于以下步骤进行训练,包括:步骤1:提取所述目标文本中的词并映射为词向量;步骤2:将所述词向量输入至循环神经网络和卷积神经网络中,分别得到表达所述目标文本上下文语义的第一特征向量和表达所述目标文本局部语义特征的第二特征向量;步骤3:根据所述第一特征向量和所述第二特征向量,求解预设的对比损失函数,所述对比损失函数越小表示所述第一特征向量和所述而特征向量越接近;步骤4:通过不断优化所述对比损失函数进行所述循环神经网络和所述卷积神经网络的优化,当所述对比损失函数小于预设阈值时训练结束,从而获取训练好的由所述循环神经网络和所述卷积神经网络所组成的事件提取模型。4.根据权利要求3所述的事件提取方法,其特征在于,将所述词向量输入至循环神经网络中,得到表达所述目标文本上下文语义的第一特征向量,包括:将所述词向量输入至循环神经网络中,得到所述循环神经网络正向输出的所述目标文本上文特征向量和后向输出的所述目标文本下文特征向量;将所述上文特征向量与所述下文特征向量进行特征融合,得到表达所述目标文本上下文语义的第一特征向量。5.根据权利要求3所述的事件提取方法,其特征在于,所述对比损失函数为:T+其中,LN为对比损失函数,f(x)为锚点特征向量,f(x)为表达所述目标文本上下文语义的第一特征向量,N为目标文本数量,f(xi)为第i个表达所述目标文本局部语义特征的第二特征向量。6.根据权利要求4所述的事件提取方法,其特征在于,将所述上文特征向量与所述下文特征向量进行特征融合,得到表达所述目标文本上下文语义的第一特征向量,包括:根据下面第一公式将所述上文特征向量与所述下文特征向量进行特征融合,得到表达所述目标文本上下文语义的第一特征向量;所述第一公式为:2CN113723108A权利要求书2/2页T其中,Ht为第一特征向量,w为转置向量,为上文特征向量,为下文特征向量,b为偏置值,α和β分别为上文特征向量和下文特征向量对应的权值。7.根据权利要求3所述的事件提取方法,其特征在于,将所述词向量输入至卷积神经网络中,得到表达所述目标文本局部语义特征的第二特征向量,包括:根据下面第二公式将所述词向量输入至卷积神经网络中,得到表达所述目标文本局部语义特征的第二特征向量;所述第二公式为:ft=f(kivt:t+j‑1+b)其中,ft为第二特征向量,j为卷积核k的窗口大小,b为偏置值,i为当前卷积神经网络层数,ki为第i层卷积核,kivt:t+j‑1为第t到第t+j‑1的词向量。8.一种事件提取装置,其特征在于,包括:处理模块,用于获取目标文本,将所述目标文本输入至事件提取模型