一种热词挖掘方法、装置、设备及存储介质.pdf
一只****写意
亲,该文档总共18页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
相关资料
一种热词挖掘方法、装置、设备及存储介质.pdf
本申请提供了一种热词挖掘方法、装置、设备及存储介质,方法包括:获取目标文本中标题的表达向量,其中,目标文本包含所述标题和所述标题对应的正文;利用标题的信息确定正文中每个词对于正文表达的贡献度,并根据正文中每个词对于正文表达的贡献度确定正文的表达向量;根据标题的表达向量和正文的表达向量生成热词。本申请提供的热词挖掘方法能够及时挖掘出热词,且不涉及安全性和隐私性问题。
目标词的挖掘方法、装置、电子设备及存储介质.pdf
本公开提供了一种目标词的挖掘方法、装置、电子设备及存储介质,涉及机器学习与智能搜索等人工智能技术领域。具体实现方案为:基于物料库中各物料的信息,挖掘各所述物料对应的多个原始词;基于各所述物料的所述多个原始词,进行词语扩展,得到各所述物料对应的多个扩展词;从各所述物料的所述多个原始词和所述多个扩展词中,筛选符合所述物料库对应的预设意图的质量最佳的预设数量的目标词。本公开的技术,能够有效地提高挖掘的目标词的准确性,进而基于挖掘的目标词进行搜索关联时,能够为物料库带来最佳的搜索流量。
一种同义词挖掘方法、装置、存储介质及电子设备.pdf
本发明提供一种同义词挖掘方法、装置、存储介质及电子设备,一种同义词挖掘方法,包括:获取目标词表;将所述目标词表中的目标单词转换为至少一种目标数据形式;从所述目标数据形式对应的预设库中检索出与目标单词相似度最高的预设数量的候选同义词;将所述候选同义词中与目标单词是同义词关系的单词对作为正样本,与目标单词不是同义词的单词对作为负样本,训练得到二分类模型;利用所述二分类模型对所述候选同义词进行分类,得到所述目标词表中各目标单词对应的同义词表。本发明提供的方案泛化能力较好且同义词的挖掘结果准确。
一种热词确定方法、装置、电子设备及存储介质.pdf
本发明实施例适用于数据处理技术领域,提供了一种热词确定方法、装置、电子设备及存储介质,其中,热词确定方法包括:对待处理文本进行分词处理,得到至少两个分词;对至少两个分词中的每个分词进行词性标注;将标注了词性后的至少两个分词中的分词进行组合,得到至少一个组合词;组合词由所述至少两个分词中在待处理文本中位置相邻的分词组成;确定至少一个组合词中的每个组合词的热度值;热度值表征对应的组合词在待处理文本中出现的频率;基于热度值确定所述待处理文本中的热词;热词表征热度值大于设定值的组合词。
一种网络热点的挖掘方法、装置、设备及存储介质.pdf
本申请实施例公开了一种网络热点的挖掘方法、装置、设备及存储介质,相关实施例可应用于云技术、人工智能以及智慧交通等各种场景,用于提高发现网络热点的准确性。本申请实施例方法包括:从原始文本数据中获取目标时段对应的基础文本数据、第一历史时段对应的第一文本数据以及第二历史时段对应的第二文本数据,根据选词条件从基础文本数据、第一文本数据以及第二文本数据中确定若干个目标突发词,从基础文本数据中获取包含有至少一个目标突发词的候选文本数据,对候选文本数据进行文本聚合处理,得到若干个目标文本类以及每个目标文本类中的若干个文