预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共12页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN109961777A(43)申请公布日2019.07.02(21)申请号201910118358.7(22)申请日2019.02.16(71)申请人天津大学地址300072天津市南开区卫津路92号(72)发明人于瑞国顾楠徐天一赵满坤刘志强王建荣喻梅(74)专利代理机构天津市北洋有限责任专利代理事务所12201代理人李林娟(51)Int.Cl.G10L15/16(2006.01)G10L15/06(2013.01)G10L13/10(2013.01)G10L25/24(2013.01)权利要求书1页说明书7页附图3页(54)发明名称一种基于智能机器人的语音交互方法(57)摘要本发明公开了一种基于智能机器人的语音交互方法,方法包括:获取语音语料库,构建训练数据集和测试数据集,并对数据进行预处理;计算训练数据集的梅尔频率倒谱系数;搭建python+Anaconda+Tensorflow环境,使用python的keras库训练基于卷积神经网络构建语音识别模型;调用语义理解接口,处理语音识别结果;同时使用jieba、pypinyin、pydub、pyAudio库构建语音合成模型;将软件程序打包安装在智能机器人上后,分模块进行测试,再进行整体测试,根据测试效果重复上述内容,以进行调试和修改。本发明使服务型智能机器人可以实现识别语音、“理解”人类语言和与人“说话”的基本功能,从而实现其在大型场所进行引导、介绍的功能。CN109961777ACN109961777A权利要求书1/1页1.一种基于智能机器人的语音交互方法,其特征在于,所述方法包括以下步骤:获取语音语料库,构建训练数据集和测试数据集,并对数据进行预处理;计算训练数据集的梅尔频率倒谱系数;搭建python+Anaconda+Tensorflow环境,使用python的keras库训练基于卷积神经网络构建语音识别模型,在训练模型的过程中使用梅尔频率倒谱系数;调用语义理解接口,处理语音识别结果;同时使用jieba、pypinyin、pydub、pyAudio库构建语音合成模型;将软件程序打包安装在智能机器人上后,分模块进行测试,再进行整体测试,根据测试效果重复上述内容,以进行调试和修改。2CN109961777A说明书1/7页一种基于智能机器人的语音交互方法技术领域[0001]本发明涉及语音识别、语音合成和自然语言处理领域,尤其涉及一种基于智能机器人的语音交互方法。背景技术[0002]目前语音识别技术主要有两种实现方法:隐马尔科夫法和人工神经网络。隐马尔科夫法是对语音信号的时间序列结构建立统计模型,将之看作是一个数学上的双重随机过程,HMM(隐马尔科夫)方法现已成为语音识别的主流技术,目前大多数大词汇量、连续语音的非特定人语音识别系统都是基于HMM模型的。人工神经网络模拟了人类神经活动的原理,具有自适应性、并行性、鲁棒性,其强大的分类能力和输入输出映射能力都可以很好的提高语音识别性能,但由于训练模型需要耗费较长的时间,目前发展的还不够完善。[0003]语音合成技术主要有线性预测编码技术(LPC)、基音同步叠加技术(PSOLA)以及基于幅度对数估计(LMA)声道模型的语音合成方法。LPC合成技术本质上是一种时间波形的编码技术,目的是为了降低时间域信号的传输速率。PSOLA技术在拼接语音波形片断之前,首先根据上下文的要求,用PSOLA算法对拼接单元的韵律特征进行调整,使合成波形既保持了原始发音的主要音段特征,又能使拼接单元的韵律特征符合上下文的要求,从而获得很高的清晰度和自然度。基于LMA声道模型的语音合成方法具有传统的参数合成并且可以灵活调节韵律参数的优点,同时又具有比PSOLA算法更高的合成音质。发明内容[0004]本发明提供了一种基于智能机器人的语音交互方法,本发明使服务型智能机器人可以实现识别语音、“理解”人类语言和与人“说话”的基本功能,从而实现其在大型场所进行引导、介绍的功能,详见下文描述:[0005]一种基于智能机器人的语音交互方法,所述方法包括以下步骤:[0006]获取语音语料库,构建训练数据集和测试数据集,并对数据进行预处理;[0007]计算训练数据集的梅尔频率倒谱系数;[0008]搭建python+Anaconda+Tensorflow环境,使用python的keras库训练基于卷积神经网络构建语音识别模型;[0009]调用语义理解接口,处理语音识别结果;同时使用jieba、pypinyin、pydub、pyAudio库构建语音合成模型;[0010]将软件程序打包安装在智能机器人上后,分模块进行测试,再进行整体测试,根据测试效果重复上述内容,以进行调试和修改。[0011]本发明提供的技术方案的