一种关键词提取方法、装置、设备及存储介质.pdf
书錦****by
亲,该文档总共31页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
相关资料
一种关键词提取方法、装置、设备及存储介质.pdf
本申请实施例提供了一种关键词提取方法、装置、设备及存储介质,涉及人工智能技术领域,该方法包括:对目标文本进行特征提取,获得目标文本对应的文本特征向量和目标文本包含的目标分词的分词语法向量。对目标分词进行特征提取,获得目标分词的分词语义向量,然后将分词语义向量和分词语法向量进行拼接获得第一组合向量。由于第一组合向量中包含了目标分词的语义信息和语法信息,故将目标文本的文本特征向量与第一组合向量融合后获得的融合特征向量,可以更好地表征目标文本中的核心成分。基于融合特征向量确定目标分词在目标文本中的权重值,并基于
关键词自动提取方法、装置、设备及存储介质.pdf
本发明涉及人工智能领域,具体公开了一种关键词自动提取方法、装置、设备及存储介质。该方法包括:获取用于训练的样本文本,从样本文本中提取关键词,按照关键词提取的先后顺序对关键词进行排序,依序对所有关键词进行标签处理,获得含有标签的关键词集合;将样本文本与关键词集合进行关联处理以形成训练数据集;基于训练数据集和交叉熵损失函数对预构建好的语言预测模型进行训练,利用梯度下降法迭代优化语言预测模型,获得目标语言预测模型;获取待处理文本并将待处理文本输入目标语言预测模型中,输出包含标签的目标关键词集合,根据标签从目标关
关键词提取方法、装置、电子设备及存储介质.pdf
本公开关于一种关键词提取方法、装置、电子设备及存储介质,涉及文本处理技术领域。所述方法包括:基于已构建的词表对待提取文本进行分词处理,将所述待提取文本划分为多个词语;确定各所述词语的统计特征并计算所述词语的统计特征的加权值,依据所述加权值对所述词语进行筛选,得到候选词;将所述待提取文本及所述候选词输入预先训练好的深度语义匹配模型,依据输出结果从所述待提取文本中提取出关键词,所述深度语义匹配模型用于预测所述待提取文本与所述候选词的语义相似度。本公开在对待提取文本进行关键词提取时,综合考虑了统计特征与语义特征
关键词的提取方法、装置、电子设备及可读存储介质.pdf
本公开提供了关键词的提取方法、装置、电子设备及可读存储介质,涉及数据处理技术领域,尤其涉及NLP领域。具体实现方案为:确定目标文本的第一分词在目标文本所包含的各个句子中的第一词频;对第一词频进行平滑处理得到第二词频;基于第二次词频确定第一分词在目标文本中的第三词频;基于第三词频从第一分词中确定第一关键词。基于本方案,通过对第一词频进行平滑处理,能够降低数值较大的第一词频中对关键词提取的影响幅度,避免仅因词在目标文本中的局部高频出现而被作为关键词提取的情况,提升关键词的提取准确率。
一种关键词提取、模型训练方法、装置、设备及存储介质.pdf
本公开提供了一种关键词提取、模型训练方法、装置、设备及存储介质,涉及数据处理技术领域,尤其涉及内容分发技术领域、自然语言处理技术领域。上述关键词提取方案为:获得待处理的目标文本;提取目标文本的文本特征;对目标文本的文本特征进行全局特征提取,得到目标文本的全局特征,其中,目标文本的全局特征用于表征目标文本整体所表达的语义;对目标文本的文本特征进行局部特征提取,得到目标文本的局部特征,其中,目标文本的局部特征用于表征目标文本中每一字符所在上下文所表达的语义;基于目标文本的全局特征以及局部特征,提取目标文本的关