文本纠错方法和系统.pdf
雨巷****怡轩
亲,该文档总共20页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
相关资料
文本纠错方法和系统.pdf
本公开提出了一种文本纠错方法和系统。该方法包括:接收待纠错文本;使用多种分词方法将待纠错文本切分成多种粒度的子词序列;对每种粒度的子词序列进行纠错以获得每种粒度的候选纠错文本;融合各种粒度的候选纠错文本以确定目标纠错文本;以及输出所确定的目标纠错文本。
一种图像文本识别纠错的方法、系统、电子装置和介质.pdf
本申请涉及一种图像文本识别纠错的方法、系统、电子装置和介质,其中,该方法包括:获取图像文本数据进行数据预处理,并通过OCR模型进行识别,输出识别字符以及该识别字符对应的置信度分值、坐标;预设识别阈值,通过比较置信度分值和识别阈值进行纠错标记,得到待纠错字符,并对待纠错字符进行mask替换,通过MLM模型基于语义环境对mask位置预测字符,生成得到候选字符集和该候选字符的置信度;通过字形相似度算法,计算得到候选字符与待纠错字符之间的字形相似度,并对字形相似度与候选字符置信度进行综合计算,得到候选字符的纠错分
一种文本纠错的方法和装置.pdf
本发明公开了一种文本纠错的方法和装置,涉及智能外呼的技术领域,旨在解决现有文本纠错方法对特定应用场景的ASR识别结果检错和纠错准确率不高的问题。其技术方案要点是将待纠错文本预处理后生成待检字集合,利用预训练的语言模型预测所述待检字集合中每个字的概率分布,根据每个字的概率分布确定错字位置并生成候选字集合,将所述候选字集合中的每个字替换错字位置形成生成候选句集合,对候选句集合中的各元素进行评分,保留评分最优的所述候选句集合中的元素所对应候选字,用该候选字替换相应错字位置并输出句子。本发明达到了提高文本纠错率的
文本纠错方法及装置.pdf
本公开涉及文本识别技术领域,具体涉及一种文本纠错方法及装置。一种文本纠错方法,包括:从文本序列中识别得到待纠错实体;根据所述待纠错实体,从目标知识库中确定预设数量的候选实体;根据所述待纠错实体与每个候选实体的相似度,对所述待纠错实体执行预设处理。本公开实施方式,提高文本纠错效率和准确性。
一种文本纠错方法、系统、设备及介质.pdf
本发明提供一种文本纠错方法、系统、设备及介质,包括,获取待纠错的目标文本,并按照预设的格式标准对所述目标文本进行格式转化;通过预设的纠错模型对格式转化后的目标文本进行文本错误检测,得到错误检测结果;通过预先训练的对齐模型对所述错误检测结果进行文本召回,得到与所述错误检测结果对应的多个候选召回结果;按预设标准将多个候选召回结果进行排序,并将排序第一的候选召回结果输出为文本纠错结果。本发明提供专业领域文本纠错能力,从文章撰写和文章检查角度辅助创作,针对运行日报等结构化文档,可实现机器自动纠错,大幅提升工作效率