文本处理方法、装置、电子设备及计算机可读存储介质.pdf
猫巷****觅蓉
亲,该文档总共21页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
相关资料
文本处理方法、装置、电子设备及计算机可读存储介质.pdf
本公开提供了文本处理方法、装置、电子设备及计算机可读存储介质,涉及数据处理技术领域,尤其涉及自然语言处理或者语音转写技术领域。具体实现方案为:获取第一初始文本;基于第一初始文本以及第一初始文本对应的前序文本确定第一待处理文本,第一初始文本对应的前序文本是基于第二待处理文本的文本处理结果确定的,第二待处理文本是基于第二初始文本以及第二初始文本对应的前序文本确定的,第二初始文本为连续文本中位于第一初始文本之前的文本片段;对第一待处理文本进行文本处理,得到第一待处理文本的文本处理结果,文本处理结果包括段落分割结
文本处理方法、装置、电子设备及计算机可读存储介质.pdf
本申请实施例提供了一种文本处理方法、装置、电子设备及计算机可读存储介质,涉及自然语言处理领域。该方法包括:获取待校正的第一文本数据;将第一文本数据输入至目标处理器,得到第一文本数据的处理结果;其中,目标处理器对第一文本数据进行动词识别,得到待校正动词,并对所识别的待校正动词进行时态校正,得到待校正动词对应的目标动词;处理结果中包括该目标动词。本申请实施例基于目标处理器对第一文本数据中的动词进行时态校正,使得处理后的第一文本数据更加符合语法规范。
文本处理方法、装置、电子设备及可读存储介质.pdf
本申请实施例提供了一种文本处理方法、装置、电子设备及可读存储介质,涉及人工智能领域,该方法包括:获取多个初始文本,基于多个初始文本,构建训练数据集;基于训练数据集对初始神经网络模型进行训练,直至模型的目标函数的值满足训练结束条件;将训练结束后的特征提取模块作为文本相似度判断模型的文本特征提取模块,对文本相似度判断模型再次进行训练,得到最终的文本相似度判断模型,文本相似度判断模型包括级联的文本特征提取模块和第二文本相似度预测模块。在本申请实施例中所构建的训练数据集为弱监督文本相似语料,可以无需人工标注标签数
文本处理方法及装置、电子设备和计算机可读存储介质.pdf
本公开提供了一种文本处理方法及装置、电子设备和计算机可读存储介质,可以应用于自然语言处理领域和金融领域。该文本处理方法包括:响应于接收到初始搜索文本,根据初始搜索文本,从历史文本数据库中确定与初始搜索文本具有关联关系的初始历史文本,其中,历史文本数据库包括至少一个历史文本和至少一个匹配文本,至少一个历史文本和至少一个匹配文本一一对应;根据初始搜索文本和初始历史文本,获取网络知识文本;利用网络知识文本,分别对初始搜索文本和初始历史文本进行文本嵌入处理,得到处理后的目标搜索文本和目标历史文本;根据目标搜索文本
文本处理方法、装置、电子设备和可读存储介质.pdf
本申请实施例提供了一种文本处理方法、装置、电子设备和可读存储介质,涉及计算机技术领域。在本申请实施例中,本申请实施例可以接收目标文本,并对目标文本进行文本规则检测和模型检测。进一步的,本申请实施例可以根据规则检测的结果和模型检测的结果,对目标文本进行纠错处理,从而确定目标文本对应的纠错文本。其中,由于本申请实施例在对目标文本进行纠错的过程中,既对目标文本进行了文本规则检测,也对目标文本进行了模型检测,因此,本申请实施例可以从多个维度对目标文本进行纠错,实现了对目标文本的全面纠错。