预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共12页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN110853674A(43)申请公布日2020.02.28(21)申请号201810820373.1(22)申请日2018.07.24(71)申请人中兴通讯股份有限公司地址518000广东省深圳市南山区高新技术产业园科技南路中兴通讯大厦(72)发明人王柏鸥(74)专利代理机构北京元本知识产权代理事务所11308代理人金海荣(51)Int.Cl.G10L25/51(2013.01)G10L25/24(2013.01)G06K9/62(2006.01)G10L13/08(2013.01)G10L15/26(2006.01)权利要求书1页说明书7页附图3页(54)发明名称文本核对方法、设备以及计算机可读存储介质(57)摘要本申请实施例公开一种文本核对方法、设备以及计算机可读存储介质,该方法包括:获取输入语音特征向量和标准语音特征向量;对所述输入语音特征向量和所述标准语音特征向量进行相似度分析,得到文本核对匹配度;将所述文本核对匹配度的值与预设阈值进行比较,并根据比较结果确定文本核对结果。本申请实施例通过对输入语音特征向量和标准语音特征向量进行相似度分析,进而确定文本核对结果;一方面保留输入语音的特征向量进行核对,避免解码过程中信息损失和受语言模型干扰;另一方面提高了语音交互中文本核对的准确性,同时为业务处理提供了更大的灵活性。CN110853674ACN110853674A权利要求书1/1页1.一种文本核对方法,所述方法包括:获取输入语音特征向量和标准语音特征向量;对所述输入语音特征向量和所述标准语音特征向量进行相似度分析,得到文本核对匹配度;将所述文本核对匹配度的值与预设阈值进行比较,并根据比较结果确定文本核对结果。2.根据权利要求1所述的方法,其特征在于,所述获取输入语音特征向量包括:获取输入语音;提取所述输入语音的特征,生成所述输入语音特征向量。3.根据权利要求2所述的方法,其特征在于,所述提取所述输入语音的特征,生成所述输入语音特征向量,之前还包括:确定所述输入语音的核对场景;所述提取所述输入语音的特征,生成所述输入语音特征向量包括:根据所述输入语音的核对场景提取所述输入语音的特征,生成所述输入语音特征向量。4.根据权利要求3所述的方法,其特征在于,所述核对场景包括姓名核对场景、车牌核对场景、地址核对场景中的至少一种。5.根据权利要求2所述的方法,其特征在于,所述提取所述输入语音的特征,生成所述输入语音特征向量,之前还包括:剔除所述输入语音中的非关键语音信息。6.根据权利要求2所述的方法,其特征在于,所述提取所述输入语音的特征包括:通过Mel频率倒谱系数MFCC规则和端点检测方式提取所述输入语音的特征。7.根据权利要求1所述的方法,其特征在于,所述获取标准语音特征向量包括:获取预期文本;将所述预期文本转换生成所述标准语音特征向量。8.根据权利要求1所述的方法,其特征在于,所述对所述输入语音特征向量和所述标准语音特征向量进行相似度分析包括:对所述输入语音特征向量和所述标准语音特征向量进行相似度度量和距离度量。9.一种文本核对设备,其特征在于,所述设备包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的文本核对程序,所述文本核对程序被所述处理器执行时实现如权利要求1至8中任一项所述的文本核对方法的步骤。10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有文本核对程序,所述文本核对程序被处理器执行时实现如权利要求1至8中任一项所述的文本核对方法的步骤。2CN110853674A说明书1/7页文本核对方法、设备以及计算机可读存储介质技术领域[0001]本申请实施例涉及人机语音交互技术领域,尤其涉及一种文本核对方法、设备以及计算机可读存储介质。背景技术[0002]目前在保险等行业开始尝试开展智能外呼业务。系统集成TTS(TextToSpeech,文语转换)/ASR(AutomatedSpeechRecognition,自动语音识别)引擎,通过电话方式呼通用户后,自动播放语音与用户沟通确认,在话音和互动性上模拟和接近话务员的沟通效果。交互过程中除了播放问题让用户选择性回答外,一般会涉及与客户核对身份,年龄、联系方式及住址等。[0003]业界各厂商的ASR引擎支持将语音识别为文本后上报给业务,业务再与期望文本进行比对和匹配等处理。此种方式对固定词汇识别率较高(如询问用户对某产品是否满意,用户回答满意),但在特定领域,如姓名核对,由于客户非标准普通话和口音问题,如果直接将ASR识别结果匹配用户名称,成功率较低,原因是通过语音识别生成文本的过程中,在声学模型匹配和语言模型取舍时,非此即比的判断会导致信息的误判,很难与实际的姓名匹配,即使