一种关键词提取方法、装置及设备.pdf
努力****爱静
亲,该文档总共23页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
相关资料
一种关键词提取方法、装置及设备.pdf
本申请的一个或多个实施例提出关键词提取方法、装置及设备。该方法可以包括,基于TextRank算法从与预设的多个目标分类分别对应的语料文档中确定候选关键词。基于确定的上述候选关键词,构建与上述多个目标分类分别对应的多个候选关键词集合。针对与任一目标分类对应的目标候选关键词集合中的任一目标候选关键词,统计上述多个候选关键词集合中,包含该目标候选关键词的候选关键词集合的数量。确定上述目标候选关键词集合中,是否可以包括上述数量达到阈值的候选关键词;如果是,将该候选关键词从上述目标候选关键词集合中删除,以得到与上述
一种关键词提取方法、装置、设备及存储介质.pdf
本申请实施例提供了一种关键词提取方法、装置、设备及存储介质,涉及人工智能技术领域,该方法包括:对目标文本进行特征提取,获得目标文本对应的文本特征向量和目标文本包含的目标分词的分词语法向量。对目标分词进行特征提取,获得目标分词的分词语义向量,然后将分词语义向量和分词语法向量进行拼接获得第一组合向量。由于第一组合向量中包含了目标分词的语义信息和语法信息,故将目标文本的文本特征向量与第一组合向量融合后获得的融合特征向量,可以更好地表征目标文本中的核心成分。基于融合特征向量确定目标分词在目标文本中的权重值,并基于
一种关键词提取方法和装置.pdf
本发明实施例提供一种关键词提取方法和装置。利用分词器对文本进行分词得到单词,对所述单词进行过滤得到候选关键词;计算任意两个所述候选关键词之间的相似度;根据所述相似度计算所述候选关键词的权重,根据预设的语料库计算所述候选关键词的逆文档频率;根据所述候选关键词的权重和所述逆文档频率,获取所述候选关键词的关键度,根据所述候选关键词的关键度选取关键词,提高了关键词抽取的准确率。
文本关键词提取方法、装置、设备及介质.pdf
本申请提供一种文本关键词提取方法、装置、设备及介质,该方法包括:获取目标输入文本,将目标输入文本与预设关键词库进行匹配;根据匹配结果获取目标输入文本的若干候选关键词,根据若干候选关键词和目标输入文本,构建目标输入文本对应的所有文本句式及其对应的候选关键词组合;分别获取所有文本句式与目标输入文本之间的相似度,并将相似度大于预设阈值的文本句式确定为候选文本句式;在候选文本句式存在多个的情况下,将候选文本句式对应的关键词组合输入至概率分析模型中,基于概率分析模型获取候选文本句式对应的关键词组合的组合概率,将组合
提取关键词的方法及装置.pdf
本申请提供一种提取关键词的方法及装置。本申请提出的技术方案中,通过获取第一文档的N个词汇中每个词汇的第一文档频率和N个词汇中每个词汇的第二文档频率,再根据所述N个词汇中每个词汇的第一文档频率和第二文档频率,确定所述每个词汇在所述第一文档中的重要程度,最后根据所述N个词汇中每个词汇在所述第一文档中的重要程度,从所述N个词汇中确定所述第一文档的关键词。该技术方案中,考虑了词汇在类间分布情况和类内分布情况,实现了对关键词更加准确的提取。