文本纠错方法及装置.pdf
努力****骞北
亲,该文档总共23页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
相关资料
文本纠错方法及装置.pdf
本公开涉及文本识别技术领域,具体涉及一种文本纠错方法及装置。一种文本纠错方法,包括:从文本序列中识别得到待纠错实体;根据所述待纠错实体,从目标知识库中确定预设数量的候选实体;根据所述待纠错实体与每个候选实体的相似度,对所述待纠错实体执行预设处理。本公开实施方式,提高文本纠错效率和准确性。
文本纠错方法、装置、设备及存储介质.pdf
本发明涉及人工智能技术领域,提供一种文本纠错方法、装置、设备及存储介质,用于提高文本纠错的准确性和效率。文本纠错方法包括:获取原始文本数据集的目标混淆词典,并通过目标混淆词典,对原始文本数据集进行字词替换,得到错别字文本数据集;获取再训练文本数据集,通过错别字文本数据集、预设损失函数和再训练文本数据集,对预置的初始文本纠错模型进行训练,得到目标文本纠错模型,目标文本纠错模型包括基于bert模型的校正网络;获取待处理文本,通过目标文本纠错模型和目标混淆词典,对待处理文本依次进行位置错别字概率计算和字典字词纠
文本纠错方法、装置、设备及存储介质.pdf
本发明涉及人工智能技术领域,公开了一种文本纠错方法、装置、设备及存储介质,该方法包括:获取待纠错文本序列;将待纠错文本序列输入Bert模型中,对待纠错文本序列中错别字进行识别,得到错别字集合,基于预设候选字集合对错别字集合进行纠错,得到纠错后的目标文本序列;依次从目标文本序列中提取纠错后的第一目标字并获取与第一目标字对应的纠错前的第二目标字,计算第一目标字和第二目标字之间的字形相似度以及字相似度;根据字形相似度和字相似度计算纠错判断因子,将纠错判断因子与预设阈值进行比对,根据比对结果确定待纠错文本序列的纠
一种文本纠错的方法和装置.pdf
本发明公开了一种文本纠错的方法和装置,涉及智能外呼的技术领域,旨在解决现有文本纠错方法对特定应用场景的ASR识别结果检错和纠错准确率不高的问题。其技术方案要点是将待纠错文本预处理后生成待检字集合,利用预训练的语言模型预测所述待检字集合中每个字的概率分布,根据每个字的概率分布确定错字位置并生成候选字集合,将所述候选字集合中的每个字替换错字位置形成生成候选句集合,对候选句集合中的各元素进行评分,保留评分最优的所述候选句集合中的元素所对应候选字,用该候选字替换相应错字位置并输出句子。本发明达到了提高文本纠错率的
一种文本纠错的处理方法及装置.pdf
本发明提供一种文本纠错的处理方法及装置,该方法包括:当接收到文本纠错指令时,获取待纠错文本;利用预设错误检测方法检测待纠错文本,得到待纠错对象;利用预设知识图谱和预设字典对待纠错对象进行候选召回,得到候选纠错集合,候选纠错集合包括多个候选对象;针对每个候选对象,将待纠错文本中的待纠错对象替换为候选对象,得到纠错后文本;计算每个纠错后文本的匹配度;将所有匹配度进行排序,并输出序位最高的匹配度对应的纠错后文本。通过预设错误检测方法检测出待纠错文本中的待纠错对象,利用候选召回解决待纠错文本中的拼写错误和语法错误