文本纠错方法、装置、电子设备与存储介质.pdf
一条****轩吗
亲,该文档总共19页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
相关资料
文本纠错方法、装置、电子设备与存储介质.pdf
本发明提供一种文本纠错方法、装置、电子设备与存储介质,所述方法包括:对待纠错文本进行错误定位,得到所述待纠错文本中的候选错误文本;响应于用户针对所述候选错误文本的指定操作,从所述候选错误文本中确定错误文本,并基于所述错误文本对所述待纠错文本进行纠错,得到所述待纠错文本的目标文本。本发明提供的方法、装置、电子设备与存储介质,通过对待纠错文本进行错误定位以及纠错,从而得到待纠错文本的目标文本,整个过程方便快捷,极大地提升了文本纠错的效率和准确性,降低了用户的操作成本,并且,对候选错误文本进行展示,可以帮助用户
文本纠错方法、装置、电子设备及存储介质.pdf
本发明涉及人工智能及数字医疗技术,揭露了一种文本纠错方法,包括:对待处理文本分词,得到分词集,对分词集中的各个分词进行同音词查询,利用查询到的同音词替换对应的分词,得到多个标准文本,分别计算标准文本的困惑度,选择困惑度大于或者等于预设困惑阈值的标准文本为目标文本,利用标准纠错模型对所述目标文执行纠错处理,得到初始纠错结果,利用豁免词典对初始纠错结果进行剔除,得到标准纠错结果。此外,本发明还涉及区块链技术,分词集可存储于区块链的节点。本发明还提出一种文本纠错装置、电子设备以及存储介质。本发明可以提高文本纠错
文本的纠错方法及装置、电子设备和存储介质.pdf
本申请实施例提供了一种文本的纠错方法及装置、电子设备和存储介质,所述方法包括:获取目标领域的文本数据并依据与所述目标领域对应的预设规则确定待纠错的第一文本;利用目标模型对所述待纠错的第一文本进行处理,其中,所述目标模型由数据对集合对初始模型进行训练得到,所述数据对为包含待纠错词汇和正确词汇的词汇数据对;以及在所述待纠错的第一文本中包括所述待纠错词汇的情况下,通过所述目标模型输出纠错结果,其中,所述纠错结果包括所述待纠错的第一文本以及与所述待纠错词汇对应的正确词汇。上述方案解决了现有技术中只针对明确的句法及
文本纠错方法、装置、设备及存储介质.pdf
本发明涉及人工智能技术领域,公开了一种文本纠错方法、装置、设备及存储介质,该方法包括:获取待纠错文本序列;将待纠错文本序列输入Bert模型中,对待纠错文本序列中错别字进行识别,得到错别字集合,基于预设候选字集合对错别字集合进行纠错,得到纠错后的目标文本序列;依次从目标文本序列中提取纠错后的第一目标字并获取与第一目标字对应的纠错前的第二目标字,计算第一目标字和第二目标字之间的字形相似度以及字相似度;根据字形相似度和字相似度计算纠错判断因子,将纠错判断因子与预设阈值进行比对,根据比对结果确定待纠错文本序列的纠
文本纠错方法、装置、设备及存储介质.pdf
本发明涉及人工智能技术领域,提供一种文本纠错方法、装置、设备及存储介质,用于提高文本纠错的准确性和效率。文本纠错方法包括:获取原始文本数据集的目标混淆词典,并通过目标混淆词典,对原始文本数据集进行字词替换,得到错别字文本数据集;获取再训练文本数据集,通过错别字文本数据集、预设损失函数和再训练文本数据集,对预置的初始文本纠错模型进行训练,得到目标文本纠错模型,目标文本纠错模型包括基于bert模型的校正网络;获取待处理文本,通过目标文本纠错模型和目标混淆词典,对待处理文本依次进行位置错别字概率计算和字典字词纠