预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共14页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN115759036A(43)申请公布日2023.03.07(21)申请号202211334721.7(22)申请日2022.10.28(71)申请人中国矿业大学(北京)地址100083北京市海淀区学院路丁11号(72)发明人闫琰李天诚张博文李文捷(74)专利代理机构北京棘龙知识产权代理有限公司11740专利代理师杨培芳(51)Int.Cl.G06F40/205(2020.01)G06F40/242(2020.01)G06F40/284(2020.01)G06N3/08(2023.01)权利要求书3页说明书8页附图2页(54)发明名称基于推荐的事件检测模型的构建方法及利用模型进行事件检测的方法(57)摘要一种基于推荐的事件检测模型的构建方法包括:对包含事件文本、触发词、事件类型的原始数据集进行预处理,构建初始的基于推荐的事件检测模型及初始参数,所述模型包括BERT层、触发词超图卷积层、触发词判别器、事件类型超图卷积层、注意力权重层、神经协同过滤层、预测层;对模型进行触发词和事件类型层面的训练;一种使用基于推荐的事件检测模型进行事件检测的方法为将包含事件类型、正采样事件文本及负采样事件文本输入至基于推荐的事件检测模型中根据交互分数推荐top‑k个事件文本;本发明提供的方法是无触发词的事件检测,因此消除了因人为标注触发词产生的人工成本,同时,本发明将推荐思想应用到事件检测中,能够更加精准的完成事件检测。CN115759036ACN115759036A权利要求书1/3页1.一种基于推荐的事件检测模型的构建方法,其特征在于,所述方法包括:对包含事件文本、触发词、事件类型的原始数据集进行预处理:将原始数据集中的事件文本、触发词、事件类型提取出来保存在JSON文件中,每条数据的事件文本、触发词、事件类型构成一个数据样本;将预处理后的数据集按比例划分为测试集和训练集;对训练集中的每个数据样本分别生成事件文本、触发词、事件类型的映射整数,分别构建事件文本‑映射整数字典、触发词‑映射整数字典、事件类型‑映射整数字典、事件类型‑触发词关系字典,通过所述事件文本‑映射整数字典、触发词‑映射整数字典、事件类型‑映射整数字典构建触发词粗粒度辅助张量h_ul_corase、触发词细粒度辅助张量h_ul_fine、事件类型辅助张量train_hgg;构建初始的基于推荐的事件检测模型及初始参数,所述基于推荐的事件检测模型包括:BERT层、触发词超图卷积层、触发词判别器、事件类型超图卷积层、注意力权重层、神经协同过滤层、预测层;其中,触发词超图卷积层由两个自定义层组成,事件类型超图卷积层由一个自定义层组成,将六个随机初始化的可学习参数分别作为三个所述自定义层的权重和偏置;触发词判别器包括一全连接层和一个双线性层;预测层为一个二层感知器;将所述训练集中的所有触发词输入至初始的基于推荐的事件检测模型中,经过BERT层得到触发词词向量,所述触发词词向量分别与h_ul_corase和h_ul_fine输入到触发词超图卷积层分别得到触发词粗粒度超图特征值和触发词细粒度超图特征值;针对训练集中的数据样本构建<正采样触发词,负采样触发词>的数据对,根据数据对中正采样触发词的映射整数和负采样触发词的映射整数在触发词粗粒度超图特征值和触发词细粒度超图特征值中索引得到正采样触发词粗粒度超图特征值、正采样触发词细粒度超图特征值及负采样触发词粗粒度超图特征值;正采样触发词粗粒度超图特征值和正采样触发词细粒度超图特征值经过触发词判别器后输出触发词正对分数;正采样触发词粗粒度超图特征值和负采样触发词粗粒度超图特征值经过判别器输出触发词负对分数;通过触发词正对分数和触发词负对分数计算损失值并更新模型参数;将所述训练集中所有的触发词和事件类型分别输入到更新参数后的基于推荐的事件检测模型中,经过BERT层后得到全部触发词的词向量和全部事件类型的词向量;将所有触发词词向量、触发词粗粒度辅助张量及触发词细粒度辅助张量输入至触发词超图卷积层后得到触发词粗粒度超图特征值和触发词细粒度超图特征值,将触发词粗粒度超图特征值和触发词细粒度超图特征值之和作为触发词双粒度超图特征值;将所有的事件类型词向量和事件类型辅助张量输入事件类型超图卷积层得到事件类型超图特征值;针对每一个事件类型,通过事件类型‑触发词的关系字典中索引得到该事件类型中的所有触发词,将该事件类型的所有触发词输入到更新参数后的基于推荐的事件检测模型中,经过BERT层得到该事件类型所有触发词的词向量;根据触发词‑映射整数字典获取到该事件类型所有触发词的映射整数,通过所述映射整数在所述触发词的双粒度超图特征值中索引得到该事件类型所有触发词的行向量;将所述行向量与该事件类型所有触发词的词向