预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共15页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113988063A(43)申请公布日2022.01.28(21)申请号202111288422.X(22)申请日2021.11.02(71)申请人河南中原消费金融股份有限公司地址450000河南省郑州市郑东新区康宁街99号万众大厦(72)发明人吕杨苗张雪飞吕晓东张翼飞廖艺郭腾飞冯玮(74)专利代理机构北京集佳知识产权代理有限公司11227代理人姚莹丽(51)Int.Cl.G06F40/279(2020.01)G06F40/216(2020.01)权利要求书2页说明书10页附图2页(54)发明名称一种文本纠错方法、装置、设备及计算机可读存储介质(57)摘要本发明公开了一种文本纠错方法,该方法包括以下步骤:接收待识别的目标文本;利用多模态文本纠错模型的嵌入层获取目标文本中各文字的字音特征序列、字形特征序列及字特征序列;利用多模态文本纠错模型的全连接层对字音特征序列、字形特征序列及字特征序列进行融合,得到各文字分别对应的融合特征序列;利用多模态文本纠错模型的输出层根据各融合特征序列对目标文本进行纠错操作,得到纠正后文本。应用本发明所提供的文本纠错方法,提高了模型对形似音似的文本纠错能力,提高了文本纠错的准确性。本发明还公开了一种文本纠错装置、设备及存储介质,具有相应技术效果。CN113988063ACN113988063A权利要求书1/2页1.一种文本纠错方法,其特征在于,包括:接收待识别的目标文本;利用多模态文本纠错模型的嵌入层获取所述目标文本中各文字的字音特征序列、字形特征序列及字特征序列;利用所述多模态文本纠错模型的全连接层对所述字音特征序列、所述字形特征序列及所述字特征序列进行融合,得到各所述文字分别对应的融合特征序列;利用所述多模态文本纠错模型的输出层根据各所述融合特征序列对所述目标文本进行纠错操作,得到纠正后文本。2.根据权利要求1所述的文本纠错方法,其特征在于,利用多模态文本纠错模型的嵌入层获取所述目标文本中各文字的字音特征序列、字形特征序列及字特征序列,包括:利用所述嵌入层获取所述目标文本中各所述文字的声母元素、韵母元素及声调元素,并将所述声母元素、所述韵母元素及所述声调元素转化为罗马字的字符序列;对所述字符序列进行一维卷积和最大池化操作,得到所述字音特征序列;获取各所述文字的预设维度单通道图像,并对所述预设维度单通道图像进行一维卷积和最大池化操作,得到所述字形特征序列;获取各所述文字分别对应的字特征序列。3.根据权利要求1或2所述的文本纠错方法,其特征在于,在得到各所述文字分别对应的融合特征序列之后,利用所述多模态文本纠错模型的输出层根据各所述融合特征序列对所述目标文本进行纠错操作之前,还包括:利用所述多模态文本纠错模型的推理层根据各所述融合特征序列对所述目标文本中各所述文字进行文本分类,得到文本分类结果;判断所述文本分类结果是否为存在文本错误;若是,则确定所述目标文本中的错误文字;利用所述多模态文本纠错模型的输出层根据各所述融合特征序列对所述目标文本进行纠错操作,包括:利用所述输出层根据各所述融合特征序列对所述错误文字进行纠错操作。4.根据权利要求1所述的文本纠错方法,其特征在于,当确定所述文本分类结果为不存在文本错误时,还包括:输出文本正确提示信息。5.根据权利要求3所述的文本纠错方法,其特征在于,在确定所述目标文本中的错误文字之后,利用所述输出层根据各所述融合特征序列对所述错误文字进行纠错操作之前,还包括:确定所述错误文字所属的错误类型;利用所述输出层根据各所述融合特征序列对所述错误文字进行纠错操作,包括:利用所述输出层结合各所述融合特征序列和所述错误类型对所述错误文字进行纠错操作。6.根据权利要求5所述的文本纠错方法,其特征在于,利用所述输出层结合各所述融合特征序列和所述错误类型对所述错误文字进行纠错操作,包括:按照所述错误类型对所述错误文字进行标注,得到标注结果;2CN113988063A权利要求书2/2页利用所述输出层结合各所述融合特征序列和所述标注结果对所述错误文字进行纠错操作。7.根据权利要求6所述的文本纠错方法,其特征在于,利用所述多模态文本纠错模型的输出层根据各所述融合特征序列对所述目标文本进行纠错操作,包括:利用对总损失函数最小化得到的多模态文本纠错模型的输出层根据各所述融合特征序列对所述目标文本进行纠错操作;其中,所述总损失函数由文本分类对应的文本分类损失函数、错误文字标注对应的序列标注损失函数以及文本纠错对应的文本生成损失函数求和得到。8.一种文本纠错装置,其特征在于,包括:文本接收模块,用于接收待识别的目标文本;特征序列获取模块,用于利用多模态文本纠错模型的嵌入层获取所述目标文本中各文字的字音特征序列、字形特