预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共21页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN114239611A(43)申请公布日2022.03.25(21)申请号202111460673.1G06F40/242(2020.01)(22)申请日2021.12.02G06F40/253(2020.01)(71)申请人文思海辉智科科技有限公司地址102200北京市昌平区未来科学城南区鲁疃路5号院(中国电子网络安全和信息化产业基地)A栋六层西侧663房间(72)发明人礼慧孙健郭萌陈海燕(74)专利代理机构北京市立方律师事务所11330代理人张筱宁(51)Int.Cl.G06F40/58(2020.01)G06F40/44(2020.01)G06F40/284(2020.01)权利要求书2页说明书14页附图4页(54)发明名称文本处理方法、装置、电子设备及计算机可读存储介质(57)摘要本申请实施例提供了一种文本处理方法、装置、电子设备及计算机可读存储介质,涉及自然语言处理领域。该方法包括:获取待校正的第一文本数据;将第一文本数据输入至目标处理器,得到第一文本数据的处理结果;其中,目标处理器对第一文本数据进行动词识别,得到待校正动词,并对所识别的待校正动词进行时态校正,得到待校正动词对应的目标动词;处理结果中包括该目标动词。本申请实施例基于目标处理器对第一文本数据中的动词进行时态校正,使得处理后的第一文本数据更加符合语法规范。CN114239611ACN114239611A权利要求书1/2页1.一种文本处理方法,其特征在于,包括获取待校正的第一文本数据;将所述第一文本数据输入至目标处理器,得到所述第一文本数据的处理结果;其中,所述目标处理器对所述第一文本数据进行动词识别,得到待校正动词,并对所识别的待校正动词进行时态校正,得到所述待校正动词对应的目标动词;所述处理结果中包括所述目标动词。2.根据权利要求1所述的方法,其特征在于,所述对所识别的待校正动词进行时态校正,得到所述待校正动词对应的目标动词,包括:根据预设的时态词典,确定所述待校正动词的每个备选时态;以及对所述第一文本数据中的所述待校正动词进行掩码处理,得到掩码文本;其中,所述掩码文本包括所述待校正动词的上下文信息;将所述掩码文本输入至预设预测模型,预测得到每个所述备选时态的预测概率;根据所述预测概率,确定所述备选时态中的目标时态以及所述待校正动词在所述目标时态下的目标动词。3.根据权利要求2所述的方法,其特征在于,所述将所述掩码文本输入至预设预测模型,预测得到每个所述备选时态的预测概率,包括:将所述掩码文本进行词嵌入处理,生成所述掩码文本对应的词向量;基于所述预测模型对所述词向量进行预测,得到每个所述备选时态的预测概率。4.根据权利要求2所述的方法,其特征在于,所述获取待校正的第一文本数据,包括:将待翻译的原始文本数据输入翻译器,获取翻译器输出的第一文本数据。5.根据权利要求4所述的方法,其特征在于,所述确定所述备选时态中的目标时态,包括:从所述预测概率中,获取所述待校正动词对应的备选时态的预测概率,作为第一概率;获取所述预测概率最大的备选时态作为校正时态,并将最大的所述预测概率作为第二概率;基于所述第一概率和所述第二概率确定所述备选时态中的目标时态。6.根据权利要求5所述的方法,其特征在于,所述基于所述第一概率和所述第二概率确定所述备选时态中的目标时态,包括:当所述第一概率和所述第二概率的概率差值不小于预设阈值,则将所述校正时态作为目标时态;当所述第一概率和所述第二概率的概率差值小于预设阈值,则将所述待校正动词对应的备选时态作为目标时态。7.根据权利要求1所述的方法,其特征在于,所述方法,还包括:获取预设训练集中的各标准文本和所述标准文本中标准动词;将所述标准文本中的标准动词进行掩码处理,得到标准掩码数据;将各所述标准掩码数据输入预设初始模型,得到所述初始模型实时输出的标签动词;基于预设的损失函数计算所述标准动词和所述标签动词的差值,并实时调整所述初始模型的参数;当所述差值小于预设损失阈值,则所述初始模型收敛,得到预测模型。8.一种文本处理装置,其特征在于,包括:2CN114239611A权利要求书2/2页获取模块,用于获取待校正的第一文本数据;处理模块,用于将所述第一文本数据输入至目标处理器,得到所述第一文本数据的处理结果;其中,所述目标处理器对所述第一文本数据进行动词识别,得到待校正动词,并对所识别的待校正动词进行时态校正,得到所述待校正动词对应的目标动词;所述处理结果中包括所述目标动词。9.一种电子设备,包括存储器、处理器及存储在存储器上的计算机程序,其特征在于,所述处理器执行所述计算机程序以实现权利要求1‑7任一项所述方法的步骤。10.一种计算机可读存储介质,其上存储有计算机程序,