预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共20页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113779358A(43)申请公布日2021.12.10(21)申请号202111075599.1G06F40/253(2020.01)(22)申请日2021.09.14G06N3/04(2006.01)G06N3/08(2006.01)(71)申请人支付宝(杭州)信息技术有限公司地址310000浙江省杭州市西湖区西溪路556号8层B段801-11(72)发明人黄伟鹏(74)专利代理机构成都七星天知识产权代理有限公司51253代理人袁春晓(51)Int.Cl.G06F16/951(2019.01)G06F16/9535(2019.01)G06F16/36(2019.01)G06F40/295(2020.01)G06F40/216(2020.01)权利要求书2页说明书13页附图4页(54)发明名称一种事件检测方法和系统(57)摘要本说明书公开了一种事件检测方法和系统,所述方法包括:获取待处理文本;基于抽取模型从待处理文本中抽取一组或多组实例数据;基于一组或多组实例数据,确定一个或多个抽取三元组,进而得到抽取图谱;获取一个或多个候选事件的图谱本体定义数据,并基于此得到对应每个候选事件的本体定义图谱;确定抽取图谱分别与一个或多个候选事件的本体定义图谱的相似度;基于各相似度,从一个或多个候选事件中确定待处理文本对应的事件。CN113779358ACN113779358A权利要求书1/2页1.一种事件检测方法,所述方法包括:获取待处理文本;基于抽取模型从待处理文本中抽取一组或多组实例数据;其中,每组实例数据包括第一实体实例、所述第一实体实例对应的第一实体类型、第二实体实例、所述第二实体实例对应的第二实体类型以及两个实体类型之间的关系描述;基于所述一组或多组实例数据,确定一个或多个抽取三元组,进而得到抽取图谱;其中,抽取三元组包括实例数据中的第一实体类型、第二实体类型以及两个实体类型之间的关系描述;获取一个或多个候选事件的图谱本体定义数据,并基于此得到对应每个候选事件的本体定义图谱;其中,事件的图谱本体定义数据包括用于定义实体的实体类型以及用于定义实体类型间关系的关系描述;确定所述抽取图谱分别与所述一个或多个候选事件的本体定义图谱的相似度;基于各相似度,从所述一个或多个候选事件中确定所述待处理文本对应的事件。2.如权利要求1所述的方法,还包括:为事件定义其图谱本体定义数据;所述事件的图谱本体定义数据中的实体类型以及关系描述来自预设的本体定义数据集。3.如权利要求1或2所述的方法,所述抽取模型使用训练样本训练得到,所述训练样本的标签基于预设的本体定义数据集中的实体类型以及关系描述确定。4.如权利要求1所述的方法,所述关系描述包括以下关系中的一种或多种:动宾关系、主谓关系、定中关系和修饰关系。5.如权利要求1所述的方法,所述基于抽取模型从待处理文本中抽取一组或多组实例数据,包括:利用抽取模型处理待处理文本,得到待处理文本的标注序列以及关系矩阵;基于标注序列确定待处理文本中的实体实例及其实体类型;基于关系矩阵确定待处理文本中任意两个实体实例之间的关系描述,并将其作为对应两个实体类型之间的关系描述。6.如权利要求5所述的方法,标注序列用于标记待处理文本中属于实体实例的字或词,以及所述字或词所属的实体类型;所述关系矩阵用于标记待处理文本中任意两个字或词之间的关系描述。7.如权利要求1或5所述的方法,所述抽取模型包括以下模型中的一种或多:BERT、Transformer、StanfordNLP或LTP。8.如权利要求1所述的方法,所述确定所述抽取图谱分别与所述一个或多个候选事件的本体定义图谱的相似度,包括对于任一候选事件的本体定义图谱:利用图匹配模型处理所述抽取图谱以及所述候选事件的本体定义图谱,得到两者之间的相似度。9.如权利要求1所述的方法,还包括:基于所述一组或多组实例数据,确定一个或多个实例三元组;其中,实例三元组包括实例数据中的第一实体实例、第二实体实例及其分别对应的两个实体类型之间的关系描述;基于所述一组或多组实例三元组,确定待处理文本对应事件的事件要素。10.一种事件检测系统,所述系统包括:2CN113779358A权利要求书2/2页文本获取模块,用于获取待处理文本;抽取模块,用于基于抽取模型从待处理文本中抽取一组或多组实例数据;其中,每组实例数据包括第一实体实例、所述第一实体实例对应的第一实体类型、第二实体实例、所述第二实体实例对应的第二实体类型以及两个实体类型之间的关系描述;抽取图谱获取模块,用于基于所述一组或多组实例数据,确定一个或多个抽取三元组,进而得到抽取图谱;其中,抽取三元组包括实例数据中的第一实体类型、第二实体类型以及两个实体类型之间的关系描述