文本纠错方法、设备以及计算机可读介质.pdf
映雁****魔王
亲,该文档总共18页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
相关资料
文本纠错方法、设备以及计算机可读介质.pdf
本申请提供了一种文本纠错方法,该方案用于对表格等文字载体中的二维文本进行纠错,由于表格等文字载体中,文本的位置和内容相对固定,目标单元格位置处的文本与邻接单元格位置处的文本会根据实际的应用场景呈现一定的关联性,而候选文本的排序特征信息至少包括了所述候选文本与邻接文本之间的共现特征信息,据此计算的排序分值能够表征候选文本出现在目标单元格中的可能性大小,因此可以根据可能性大小准确地对目标单元格位置处的文本进行纠错。
文本纠错的方法、装置、设备和计算机可读存储介质.pdf
本发明实施例提供一种文本纠错的方法、装置、设备和计算机可读存储介质。该文本纠错方法包括:显示语音识别文本;接收用户眼睛在语音识别文本的聚焦点,确定聚焦点的驻留信息,驻留信息包括驻留时长;当驻留时长满足预设条件时,确定聚焦点对应的待修改文本,并显示待修改文本的候选文本;当聚焦点移动时,确定对应聚焦点移动时刻的候选文本;将待修改文本修改为对应聚焦点移动时刻的候选文本。本发明实施例能够在无需用户输入的情况下,方便、快捷的纠正文本出现的错误识别,并且能够实现快速、准确的纠正文本错误。
文本纠错方法、电子设备及计算机可读存储介质.pdf
本申请实施例涉及计算机技术领域,公开了一种文本纠错方法、电子设备及计算机可读存储介质。对待纠错词汇按字粒度进行切分,得到若干检索片段;其中,检索片段的类型为单个字母或汉字拼音;在预设的索引词元集合中,确定与检索片段一致的目标索引词元;其中,索引词元集合中的索引词元的类型包括单个字母和汉字拼音;根据目标索引词元在预设的索引中进行检索,得到和目标索引词元顺序一致的若干专有名词作为候选词;根据待纠错词汇的字频和候选词的字频计算编辑距离,对候选词打分,得到候选词对应的分数;将分数最高的候选词作为纠错结果,替换待纠
一种文本纠错方法、装置、设备及计算机可读存储介质.pdf
本发明公开了一种文本纠错方法,该方法包括以下步骤:接收待识别的目标文本;利用多模态文本纠错模型的嵌入层获取目标文本中各文字的字音特征序列、字形特征序列及字特征序列;利用多模态文本纠错模型的全连接层对字音特征序列、字形特征序列及字特征序列进行融合,得到各文字分别对应的融合特征序列;利用多模态文本纠错模型的输出层根据各融合特征序列对目标文本进行纠错操作,得到纠正后文本。应用本发明所提供的文本纠错方法,提高了模型对形似音似的文本纠错能力,提高了文本纠错的准确性。本发明还公开了一种文本纠错装置、设备及存储介质,具
文本核对方法、设备以及计算机可读存储介质.pdf
本申请实施例公开一种文本核对方法、设备以及计算机可读存储介质,该方法包括:获取输入语音特征向量和标准语音特征向量;对所述输入语音特征向量和所述标准语音特征向量进行相似度分析,得到文本核对匹配度;将所述文本核对匹配度的值与预设阈值进行比较,并根据比较结果确定文本核对结果。本申请实施例通过对输入语音特征向量和标准语音特征向量进行相似度分析,进而确定文本核对结果;一方面保留输入语音的特征向量进行核对,避免解码过程中信息损失和受语言模型干扰;另一方面提高了语音交互中文本核对的准确性,同时为业务处理提供了更大的灵活