基于分词的文本处理方法、装置、电子设备和存储介质.pdf
星菱****23
亲,该文档总共12页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
相关资料
基于分词的文本处理方法、装置、电子设备和存储介质.pdf
本公开提供了一种基于分词的文本处理方法、装置、电子设备和存储介质,涉及数据处理技术领域,尤其涉及大数据技术领域和云服务技术领域。具体实现方案为:对原始文本进行分词处理,得到多个字组合片段;确定多个字组合片段中每个字组合片段的关联度;去除多个字组合片段中的目标字组合片段,生成至少一个目标文本,其中,目标字组合片段包含的两个字组合片段的关联度小于预设阈值。容易注意到的是,通过计算字组合片段的关联度,过滤目标字组合片段,得到至少一个由至少一个过滤后字组合片段生成的目标文本,无需预先设置目标文本字段长度,进而解决
基于分词的文本处理方法、装置、设备及存储介质.pdf
本发明公开了一种基于分词的文本处理方法、装置、设备及存储介质,其中,该基于分词的文本处理方法包括:获取原始文本,采用分词工具的搜索引擎分词模式对原始文本进行文本分词,获取文本分词结果,文本分词结果包括至少n个一级分词;若任意连续k个一级分词中连续k‑1个一级分词的叠加等于第k个一级分词,且连续k‑1个一级分词中存在至少两个二级分词的结合等于第k个一级分词,则仅保留至少两个二级分词,获取分词优化结果。该方法可删除重复语义或无实际意义的分词,提高分词工具的分词准确性,简化分词结果,利于后续基于正确的分词结果继
文本处理方法、装置、电子设备和存储介质.pdf
本公开提供了一种文本处理方法、装置、电子设备和存储介质,涉及数据处理技术领域,尤其涉及深度学习技术领域和语义匹配技术领域,该方法包括:获取待查询的第一文本;对第一文本进行特征处理,得到第一特征向量;将第一特征向量与多个第二特征向量进行对比,确定与第一特征向量匹配的目标特征向量;基于目标特征向量确定与第一文本匹配的查询结果。容易注意到的是,第一特征向量是用户侧的特征,第二特征向量是查询侧的特征向量,本公开可以将查询侧的特征和内容侧的特征同时进行处理,可以进行全局处理,从而解决了难以同时保证语义匹配精度和处理
文本处理方法、装置、电子设备和存储介质.pdf
本公开提供了一种文本处理方法、装置、电子设备和存储介质,应用于文本处理技术领域,包括:获取商品的介绍文本,该介绍文本包括多个句子,将介绍文本划分为多个部分,并确定多个部分的每个部分的中心句,在每个部分中,按照随机变量P~E(λ)进行采样,得到每个部分对应的采样句,将每个部分对应的采样句进行合并,得到输入文本。
文本处理方法及装置、存储介质和电子设备.pdf
本公开提供一种文本处理方法、文本处理装置、存储介质和电子设备,涉及计算机技术领域。该文本处理方法包括:通过用于表示字符串的目标文本标识,获取目标字符串;根据所述目标字符串的显示信息,确定所述目标字符串中已处理字符串的第一类型信息和第二类型信息;响应于渲染指令,若所述第一类型信息满足文本条件,则对所述第二类型信息进行判断,以得到判断结果;根据所述判断结果,对所述目标字符串的属性信息进行调整,以对所述目标字符串进行渲染。本公开实施例能够进行自动适配,提高文本渲染的效率和准确性。