预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共21页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN115934925A(43)申请公布日2023.04.07(21)申请号202211372406.3G06F40/30(2020.01)(22)申请日2022.11.03G06F18/214(2023.01)(71)申请人讯飞智元信息科技有限公司地址230088安徽省合肥市高新区望江西路666号讯飞大厦8层-10层(72)发明人郑伟伟范磊汤杰锋(74)专利代理机构北京集佳知识产权代理有限公司11227专利代理师钱湾湾(51)Int.Cl.G06F16/335(2019.01)G06F16/35(2019.01)G06F40/126(2020.01)G06F40/194(2020.01)G06F40/279(2020.01)权利要求书2页说明书14页附图4页(54)发明名称一种热点事件挖掘方法、装置、存储介质及设备(57)摘要本申请公开了一种热点事件挖掘方法、装置、存储介质及设备,该方法包括:首先获取待挖掘的目标事件文本;然后将其输入至预先构建的事件分类模型,根据预先标注的热点事件的历史类别,预测其对应的热点事件类别;事件分类模型是利用无监督的聚类文本,进行有监督的训练得到的;当目标事件文本对应的热点事件类别不属于历史类别时,对目标事件文本进行文本聚类和类别聚类的串联式聚类处理,以确定其对应的新的热点事件类别。由于本申请是先利用事件分类模型对目标事件文本进行热点事件挖掘,并在确定出其不属于历史类别时,进行文本聚类和类别聚类的串联式聚类挖掘,结合有监督与无监督的热点事件挖掘方式,有效提高了热点事件挖掘结果的准确性。CN115934925ACN115934925A权利要求书1/2页1.一种热点事件挖掘方法,其特征在于,包括:获取待挖掘的目标事件文本;将所述目标事件文本输入至预先构建的事件分类模型,根据预先标注的热点事件的历史类别,预测得到所述目标事件文本对应的热点事件类别;所述事件分类模型是利用无监督的聚类文本,进行有监督的训练得到的;当所述目标事件文本对应的热点事件类别不属于历史类别时,对所述目标事件文本进行文本聚类和类别聚类的串联式聚类处理,并根据聚类结果,确定所述目标事件文本对应的新的热点事件类别。2.根据权利要求1所述的方法,其特征在于,所述对所述目标事件文本进行文本聚类和类别聚类的串联式聚类处理,并根据聚类结果,确定所述目标事件文本对应的新的热点事件类别,包括:对所述目标事件文本进行文本关键信息抽取,得到预处理后的目标事件文本;对所述预处理后的目标事件文本进行文本语义聚类,得到第一聚类结果;对所述第一聚类结果中的各个事件类别进行类别关键词、关键短语以及关键事件文本的提取,得到提取结果;对所述提取结果进行类别语义聚类,得到第二聚类结果,并根据所述第二聚类结果,确定所述目标事件文本对应的新的热点事件类别。3.根据权利要求2所述的方法,其特征在于,所述对所述目标事件文本进行文本关键信息抽取,得到预处理后的目标事件文本,包括:对所述目标事件文本进行去噪处理,得到预处理后的目标事件文本。4.根据权利要求2所述的方法,其特征在于,所述对所述预处理后的目标事件文本进行文本语义聚类,得到第一聚类结果,包括:计算所述预处理后的目标事件文本与预先存储的每个历史类别中历史热点事件文本的平均语义相似度;从所有所述平均语义相似度中选择最大平均语义相似度,并判断所述最大平均语义相似度是否大于预设第一阈值;若是,则将所述预处理后的目标事件文本的类别确定为所述最大平均语义相似度对应的历史类别,得到第一聚类结果;若否,则将所述预处理后的目标事件文本的类别确定为新增热点事件类别,得到第一聚类结果。5.根据权利要求2所述的方法,其特征在于,所述对所述第一聚类结果中的各个事件类别进行类别关键词以及关键事件文本的提取,得到提取结果,包括:将所述第一聚类结果中各个事件类别中的热点事件文本进行去重排序处理,并将各个事件类别中处理后的文本进行拼接和分词,得到各个事件类别对应的分词文本;利用预设的无监督提取方式,提取出所述各个事件类别对应的文本的关键词,并根据所述关键词的统计信息,提取出关键短语;根据预设的关键词规则,匹配出所述各个事件类别中的关键事件文本,得到包含所述关键词、所述关键短语以及所述关键事件文本的提取结果。6.根据权利要求5所述的方法,其特征在于,所述对所述提取结果进行类别语义聚类,2CN115934925A权利要求书2/2页得到第二聚类结果,并根据所述第二聚类结果,确定所述目标事件文本对应的新的热点事件类别,包括:将所述提取结果中的关键词、关键短语和关键事件文本进行语义融合,得到所述各个事件类别对应的语义融合向量;计算所述各个事件类别对应的语义融合向量与预先存储的每个历史类别的类别语义相似度;