基于比较模型的文本处理方法、装置、设备与存储介质.pdf
文光****iu
亲,该文档总共20页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
相关资料
基于比较模型的文本处理方法、装置、设备与存储介质.pdf
本申请涉及人工智能技术领域,本申请提供一种基于比较模型的文本处理方法、装置、设备与存储介质,文本处理方法包括:对用户的语音数据对应的目标文本进行语义特征提取,获得第一语义向量,获取每个预设文本的第二语义向量,通过相似度比较模型对所述第一语义向量与所述第二语义向量进行相似度比较,获得第一文本集合,获取目标文本包含的第一关键词和预设文本包含的第二关键词,将第一关键词与第二关键词进行匹配,获得第二文本集合,根据第一文本集合和所述第二文本集合,确定目标文本集合,所述目标文本集合是所述第一文本集合和所述第二文本集合
基于分词的文本处理方法、装置、设备及存储介质.pdf
本发明公开了一种基于分词的文本处理方法、装置、设备及存储介质,其中,该基于分词的文本处理方法包括:获取原始文本,采用分词工具的搜索引擎分词模式对原始文本进行文本分词,获取文本分词结果,文本分词结果包括至少n个一级分词;若任意连续k个一级分词中连续k‑1个一级分词的叠加等于第k个一级分词,且连续k‑1个一级分词中存在至少两个二级分词的结合等于第k个一级分词,则仅保留至少两个二级分词,获取分词优化结果。该方法可删除重复语义或无实际意义的分词,提高分词工具的分词准确性,简化分词结果,利于后续基于正确的分词结果继
模型训练、文本处理方法、装置、设备及存储介质.pdf
本公开涉及一种模型训练、文本处理方法、装置、设备及存储介质。本公开通过将第一样本文本转换为抽象语义图,将抽象语义图转换为图序列,并将图序列转换为图表示向量。然后根据图表示向量和文本表示向量,对机器学习模型进行训练。由于抽象语义图中每个节点对应的语义概念是被抽象和规范化之后的概念,因此,表示稀疏的问题得到缓解同时降低了抽象语义图的歧义性。另外,将抽象语义图引入到基于图表示向量和文本表示向量的对比表示学习过程中,使得训练后的机器学习模型可以通过图表示向量准确反映文本的语义,因此图表示向量可以增强文本表示向量,
文本处理方法、装置、设备及存储介质.pdf
本公开提供了一种文本处理方法、装置、设备及存储介质,涉及数据处理领域,尤其涉及人工智能、大数据处理领域。具体实现方案为:从多个初始待处理句中筛选出包含目标关键词的初始待处理句,作为候选待处理句,得到包含有至少一个所述候选待处理句的候选集合;其中,所述目标关键词为从关键词集合中的多个初始关键词中选取出的;所述初始关键词为属于目标领域的关键词;将所述候选待处理句,与包含有所述目标关键词的目标关键句进行比较,得到第一相似度信息;将所述第一相似度信息满足第一相似度规则的候选待处理句,作为属于所述目标领域的目标处理
基于分词的文本处理方法、装置、电子设备和存储介质.pdf
本公开提供了一种基于分词的文本处理方法、装置、电子设备和存储介质,涉及数据处理技术领域,尤其涉及大数据技术领域和云服务技术领域。具体实现方案为:对原始文本进行分词处理,得到多个字组合片段;确定多个字组合片段中每个字组合片段的关联度;去除多个字组合片段中的目标字组合片段,生成至少一个目标文本,其中,目标字组合片段包含的两个字组合片段的关联度小于预设阈值。容易注意到的是,通过计算字组合片段的关联度,过滤目标字组合片段,得到至少一个由至少一个过滤后字组合片段生成的目标文本,无需预先设置目标文本字段长度,进而解决