预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共18页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN114254089A(43)申请公布日2022.03.29(21)申请号202111479664.7(22)申请日2021.12.06(71)申请人科大讯飞股份有限公司地址230088安徽省合肥市高新区望江西路666号(72)发明人戴瑾宋时德(74)专利代理机构北京集佳知识产权代理有限公司11227代理人吴晓静(51)Int.Cl.G06F16/332(2019.01)G06F40/295(2020.01)G06K9/62(2022.01)权利要求书2页说明书11页附图4页(54)发明名称事件抽取方法、装置、设备及存储介质(57)摘要本申请实施例公开了一种事件抽取方法、装置、设备及存储介质,获取目标事件类型关联的描述性问句;在源数据中查找上述描述性问句的答案;将答案与描述性问句对应的事件角色相关联。可见,本申请方案,提供了一种新的事件抽取方法,该方法不再将事件角色作为机器学习的目标,当有新的事件角色时,只需要增加事件角色与描述性问句的对应关系即可,而该对应关系的增加操作简单、即时,不会对本申请提供的事件抽取方法产生影响,从而避免事件角色作为类别对事件抽取的影响,提高了事件抽取方法对于用户使用的便利性。CN114254089ACN114254089A权利要求书1/2页1.一种事件抽取方法,其特征在于,包括:获取目标事件类型关联的描述性问句;在源数据中查找所述描述性问句的答案;将所述答案与所述描述性问句对应的事件角色相关联。2.根据权利要求1所述的方法,其特征在于,还包括:对所述源数据进行实体抽取,得到至少一个实体;获取所述源数据中所述至少一个实体中的各个实体的权重;所述在源数据中查找所述描述性问句的答案,包括:基于所述各个实体的权重,在所述源数据中查找所述描述性问句的答案。3.根据权利要求2所述的方法,其特征在于,所述获取所述源数据中所述至少一个实体中的各个实体的权重,包括:确定各个实体对应的权重区间;对于每一个实体,在该实体对应的权重区间选择该实体的权重。4.根据权利要求2或3所述的方法,其特征在于,所述基于所述各个实体的权重,在所述源数据中查找所述描述性问句的答案,包括:获得由所述描述性问句以及所述源数据构成的句子对中的各个词的初始特征表示;每个词的初始特征表示由该词的词嵌入,实体嵌入和位置嵌入得到;所述词嵌入基于该词的自身特征确定,所述实体嵌入基于该词是否属于所述实体,以及该词属于所述实体时的所述实体的权重确定,所述位置嵌入基于该词在所述句子对中的位置确定;对所述各个词的初始特征表示进行编码,得到所述句子对中各个词的目标特征表示;根据所述句子对中的各个词的目标特征表示预测得到所述描述性问句的答案。5.根据权利要求4所述的方法,其特征在于,所述对所述源数据进行实体抽取的过程通过实体抽取模型实现,所述基于所述各个实体的权重,在所述源数据中查找所述描述性问句的答案的过程通过问答模型实现;所述实体抽取模型和所述问答模型通过联合训练得到。6.根据权利要求5所述的方法,其特征在于,所述实体抽取模型和所述问答模型联合训练的过程包括:交替训练所述实体抽取模型和所述问答模型,直至达到联合训练结束条件;其中,每次训练完所述实体抽取模型后,根据所述实体抽取模型中的第一编码模块的参数更新所述问答模型中的第二编码模块的参数;每次训练完所述问答模型后,根据所述问答模型中的第二编码模块的参数更新所述实体抽取模型中的第一编码模块的参数。7.根据权利要求6所述的方法,其特征在于,利用第一领域的语料交替训练所述实体抽取模型和所述问答模型;所述方法还包括:在交替训练所述实体抽取模型和所述问答模型之前,利用第二领域的语料对所述问答模型进行预训练,得到预训练的问答模型;所述交替训练所述实体抽取模型和所述问答模型包括:交替训练所述实体抽取模型和所述预训练的问答模型。8.一种事件抽取装置,其特征在于,包括:2CN114254089A权利要求书2/2页获取模块,用于获取目标事件类型关联的描述性问句;查找模块,用于在源数据中查找所述描述性问句的答案;关联模块,用于将所述答案与所述描述性问句对应的事件角色相关联。9.一种事件抽取设备,其特征在于,包括存储器和处理器;所述存储器,用于存储程序;所述处理器,用于执行所述程序,实现如权利要求1‑7中任一项所述的事件抽取方法的各个步骤。10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时,实现如权利要求1‑7中任一项所述的事件抽取方法的各个步骤。3CN114254089A说明书1/11页事件抽取方法、装置、设备及存储介质技术领域[0001]本申请涉及信息处理技术领域,更具体地说,涉及一种事件抽取方法、装置、设备及存储