一种文本纠错方法、系统、设备及介质.pdf
慧娇****文章
亲,该文档总共12页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
相关资料
一种文本纠错方法、系统、设备及介质.pdf
本发明提供一种文本纠错方法、系统、设备及介质,包括,获取待纠错的目标文本,并按照预设的格式标准对所述目标文本进行格式转化;通过预设的纠错模型对格式转化后的目标文本进行文本错误检测,得到错误检测结果;通过预先训练的对齐模型对所述错误检测结果进行文本召回,得到与所述错误检测结果对应的多个候选召回结果;按预设标准将多个候选召回结果进行排序,并将排序第一的候选召回结果输出为文本纠错结果。本发明提供专业领域文本纠错能力,从文章撰写和文章检查角度辅助创作,针对运行日报等结构化文档,可实现机器自动纠错,大幅提升工作效率
文本纠错方法、装置、设备及存储介质.pdf
本发明涉及人工智能技术领域,提供一种文本纠错方法、装置、设备及存储介质,用于提高文本纠错的准确性和效率。文本纠错方法包括:获取原始文本数据集的目标混淆词典,并通过目标混淆词典,对原始文本数据集进行字词替换,得到错别字文本数据集;获取再训练文本数据集,通过错别字文本数据集、预设损失函数和再训练文本数据集,对预置的初始文本纠错模型进行训练,得到目标文本纠错模型,目标文本纠错模型包括基于bert模型的校正网络;获取待处理文本,通过目标文本纠错模型和目标混淆词典,对待处理文本依次进行位置错别字概率计算和字典字词纠
文本纠错方法、装置、设备及存储介质.pdf
本发明涉及人工智能技术领域,公开了一种文本纠错方法、装置、设备及存储介质,该方法包括:获取待纠错文本序列;将待纠错文本序列输入Bert模型中,对待纠错文本序列中错别字进行识别,得到错别字集合,基于预设候选字集合对错别字集合进行纠错,得到纠错后的目标文本序列;依次从目标文本序列中提取纠错后的第一目标字并获取与第一目标字对应的纠错前的第二目标字,计算第一目标字和第二目标字之间的字形相似度以及字相似度;根据字形相似度和字相似度计算纠错判断因子,将纠错判断因子与预设阈值进行比对,根据比对结果确定待纠错文本序列的纠
一种图像文本识别纠错的方法、系统、电子装置和介质.pdf
本申请涉及一种图像文本识别纠错的方法、系统、电子装置和介质,其中,该方法包括:获取图像文本数据进行数据预处理,并通过OCR模型进行识别,输出识别字符以及该识别字符对应的置信度分值、坐标;预设识别阈值,通过比较置信度分值和识别阈值进行纠错标记,得到待纠错字符,并对待纠错字符进行mask替换,通过MLM模型基于语义环境对mask位置预测字符,生成得到候选字符集和该候选字符的置信度;通过字形相似度算法,计算得到候选字符与待纠错字符之间的字形相似度,并对字形相似度与候选字符置信度进行综合计算,得到候选字符的纠错分
一种文本纠错的方法、装置、设备和可读存储介质.pdf
本申请提供一种文本纠错的方法、装置、设备和可读存储介质,该方法通过获取待纠错文本的描述信息,其中描述信息用于表示待纠错文本的领域信息和识别信息;根据描述信息确定纠错字典,其中纠错字典是由源词语和目标词语构成的有向词对集合,不同的描述信息对应的纠错字典不同;根据纠错字典,对待纠错文本进行文本纠错。通过该方法可以达到提高文本纠错结果正确性和确定性的效果。