文本关键词提取方法、装置、设备及介质.pdf
Ch****91
亲,该文档总共18页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
相关资料
文本关键词提取方法、装置、设备及介质.pdf
本申请提供一种文本关键词提取方法、装置、设备及介质,该方法包括:获取目标输入文本,将目标输入文本与预设关键词库进行匹配;根据匹配结果获取目标输入文本的若干候选关键词,根据若干候选关键词和目标输入文本,构建目标输入文本对应的所有文本句式及其对应的候选关键词组合;分别获取所有文本句式与目标输入文本之间的相似度,并将相似度大于预设阈值的文本句式确定为候选文本句式;在候选文本句式存在多个的情况下,将候选文本句式对应的关键词组合输入至概率分析模型中,基于概率分析模型获取候选文本句式对应的关键词组合的组合概率,将组合
关键词自动提取方法、装置、设备及存储介质.pdf
本发明涉及人工智能领域,具体公开了一种关键词自动提取方法、装置、设备及存储介质。该方法包括:获取用于训练的样本文本,从样本文本中提取关键词,按照关键词提取的先后顺序对关键词进行排序,依序对所有关键词进行标签处理,获得含有标签的关键词集合;将样本文本与关键词集合进行关联处理以形成训练数据集;基于训练数据集和交叉熵损失函数对预构建好的语言预测模型进行训练,利用梯度下降法迭代优化语言预测模型,获得目标语言预测模型;获取待处理文本并将待处理文本输入目标语言预测模型中,输出包含标签的目标关键词集合,根据标签从目标关
关键词提取方法、装置、电子设备及存储介质.pdf
本公开关于一种关键词提取方法、装置、电子设备及存储介质,涉及文本处理技术领域。所述方法包括:基于已构建的词表对待提取文本进行分词处理,将所述待提取文本划分为多个词语;确定各所述词语的统计特征并计算所述词语的统计特征的加权值,依据所述加权值对所述词语进行筛选,得到候选词;将所述待提取文本及所述候选词输入预先训练好的深度语义匹配模型,依据输出结果从所述待提取文本中提取出关键词,所述深度语义匹配模型用于预测所述待提取文本与所述候选词的语义相似度。本公开在对待提取文本进行关键词提取时,综合考虑了统计特征与语义特征
关键词的提取方法、装置、电子设备及可读存储介质.pdf
本公开提供了关键词的提取方法、装置、电子设备及可读存储介质,涉及数据处理技术领域,尤其涉及NLP领域。具体实现方案为:确定目标文本的第一分词在目标文本所包含的各个句子中的第一词频;对第一词频进行平滑处理得到第二词频;基于第二次词频确定第一分词在目标文本中的第三词频;基于第三词频从第一分词中确定第一关键词。基于本方案,通过对第一词频进行平滑处理,能够降低数值较大的第一词频中对关键词提取的影响幅度,避免仅因词在目标文本中的局部高频出现而被作为关键词提取的情况,提升关键词的提取准确率。
文本要素提取方法、装置、电子设备及存储介质.pdf
本发明提供一种文本要素提取方法、装置、电子设备及存储介质,其中方法包括:确定待识别文本;对所述待识别文本中的每个子句进行要素粒度分类,得到所述每个子句的要素粒度类型,所述要素粒度类型为句粒度或词粒度;基于所述每个子句的要素粒度类型,对所述待识别文本进行要素提取,得到目标要素文本。本发明提供的方法、装置、电子设备及存储介质,能够通过对待识别文本中的每个子句进行词粒度和句粒度的分类,每个子句通过其对应的粒度类型进行要素提取,得到目标要素文本,实现了基于使用词粒度结合句粒度对文本进行非连续要素提取,在保证识别准