预览加载中,请您耐心等待几秒...
1/7
2/7
3/7
4/7
5/7
6/7
7/7

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN107368473A(43)申请公布日2017.11.21(21)申请号201710651959.5(22)申请日2017.08.02(71)申请人杜爽地址215000江苏省苏州市虎丘区以升路58号21幢1103室(72)发明人杜爽(74)专利代理机构苏州广正知识产权代理有限公司32234代理人张利强(51)Int.Cl.G06F17/27(2006.01)G06F17/28(2006.01)G06F17/30(2006.01)G10L15/22(2006.01)权利要求书1页说明书4页附图1页(54)发明名称一种语音交互的实现方法(57)摘要本发明公开了一种语音交互的实现方法,包括以下步骤,步骤一,语义识别节点库的建立;步骤二,语义识别节点库加载;步骤三,语音信号处理,对输入的语音信号进行数字处理并形成多个文字串;步骤四,语义识别节点库匹配,语义识别节点库与文字串进行匹配,如果匹配成功,则返回结果从文字串本身转变成相应节点ID,如果匹配失败,则视为识别错误处理并结束;步骤五,语音库匹配成功,按照相应ID节点的返回结果进行语音播报,播报完成并结束语音交互过程。上述一种语音交互的实现方法实现同一语义多种问询方法归一成为一个节点,在语音识别的同时,能直接匹配答案,形成语音识别,语义分析,答案匹配结合在一起的一站式语音交互过程。CN107368473ACN107368473A权利要求书1/1页1.一种语音交互的实现方法,其特征在于:包括以下步骤,步骤一,语义识别节点库的建立,所述语义识别节点库包括多个语音交互定义节点,通过将同一个语义的不同表达方式整合成一种逻辑表达公式,公式直接映射定义答案,从而形成一个基于xml的语音交互定义节点;步骤二,语义识别节点库加载,完成系统中的语义识别节点库的完全加载动作;步骤三,语音信号处理,对输入的语音信号进行数字处理并形成多个文字串;步骤四,语义识别节点库匹配,语义识别节点库与文字串进行匹配,如果匹配成功,则返回结果从文字串本身转变成相应节点ID,如果匹配失败,则视为识别错误处理并结束;步骤五,语音库匹配成功,按照相应ID节点的返回结果进行语音播报,播报完成并结束语音交互过程。2.根据权利要求1所述的一种语音交互的实现方法,其特征在于:所述步骤一中的语音交互定义节点的定义方式具体为,首先预先定义节点ID、节点主题以及节点答案,然后根据所需定义节点的具体语义定义逻辑表达式,所述逻辑表达式包括多个同级别的不同表达方式的可选择项,且在每个选择项中进行具体的逻辑定义,如若能正确识别匹配任何一个表达方式的可选择项,则返回节点答案。3.根据权利要求2所述的一种语音交互的实现方法,其特征在于:所述逻辑表达式包括第一定义符、第二定义符、第三定义符、第四定义符、第五定义符以及关键语义词,通过将第一定义符、第二定义符、第三定义符、第四定义符、第五定义符以及关键语义词进行任意的嵌套或组合或排列并形成不同表达方式的可选择项,通过第一定义符、第二定义符与同级别的不同表达方式的可选择项进行组合并形成逻辑表达式,在第一定义符内罗列同义词或同级别的可选择项,通过第二定义符分割一组同义词或同级别可选择项,在第三定义符内设置可省略项,第四定义符可代替任意文字,第五定义符为处理单元之间的区分符号。4.根据权利要求3所述的一种语音交互的实现方法,其特征在于:所述第一定义符设置为方括号,所述第二定义符设置为大括号,第三定义符设置为逗号,所述第四定义符设置为星号,第五定义符设置为空格符。5.根据权利要求1所述的一种语音交互的实现方法,其特征在于:所述基于xml的语音交互定义节点是经过人工事先进行语义分析,并提高语义分析准确率到100%,继而形成的人工定义节点。2CN107368473A说明书1/4页一种语音交互的实现方法[0001]技术领域:本发明涉及一种语音交互的实现方法,涉及人工智能技术领域。[0002]背景技术:语音识别技术,也被称为自动语音识别AutomaticSpeechRecognition,(ASR),其目标是将人类的语音中的词汇内容转换为计算机可读的输入,1920年,一款名为RadioRex的玩具狗应该可以被看做是最早的语音识别器,因为当这只狗的名字被呼唤的时候,它能够以“从底座上弹出来”这样的动作进行反应。1952年由AT&T贝尔实验室开发的Audrey语音识别系统,它能够识别10个英文数字。1960年代,人工神经网络被引入了语音识别。这一时代的两大突破是线性预测编码LinearPredictiveCoding(LPC),及动态时间规整DynamicTimeWarp技术。80年代后,研究的重点逐渐转向大词汇量、非特定人连续语音识别。在研究思路上也