预览加载中,请您耐心等待几秒...
1/9
2/9
3/9
4/9
5/9
6/9
7/9
8/9
9/9

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN115762495A(43)申请公布日2023.03.07(21)申请号202211304736.9G10L17/06(2013.01)(22)申请日2022.10.24G10L17/22(2013.01)(71)申请人深圳市捌零零在线科技有限公司地址518000广东省深圳市福田区香蜜湖街道东海社区香林路28号东海花园1期5栋14D(72)发明人胡世民(74)专利代理机构深圳中恒科专利代理有限公司44808专利代理师王丽(51)Int.Cl.G10L15/08(2006.01)G10L15/26(2013.01)G10L15/02(2006.01)G10L15/00(2006.01)权利要求书2页说明书4页附图2页(54)发明名称一种语音识别方法及语音识别装置(57)摘要本发明公开了一种语音识别方法及识别装置,具体包括以下步骤:S1:进行数据预处理,使用者首先根据其需求创建语音文件,所述语音文件包括语音数据预处理和文本数据预处理,其中所述语音数据预处理用于获取语音文件中的特征数据,所述文本数据预处理用于获取语音文件中的文本内容并提取其中出现的文字创建词典;S2:构建语音识别模型,其中所述语音识别模型基于CTC算法进行语音序列的切分。本发明提供的语音识别方法及语音识别装置具有充分提取语音数据的特征信息,同时该模型结构也采用了判断环境状态的技术,能够进一步简化语音识别的流程,通过上述方法不仅提高了语音识别的准确率,而且也提高了语音识别的效率的技术效果。CN115762495ACN115762495A权利要求书1/2页1.一种语音识别方法,其特征在于,具体包括以下步骤:S1:进行数据预处理,使用者首先根据其需求创建语音文件,所述语音文件包括语音数据预处理和文本数据预处理,其中所述语音数据预处理用于获取语音文件中的特征数据,所述文本数据预处理用于获取语音文件中的文本内容并提取其中出现的文字创建词典;S2:构建语音识别模型,其中所述语音识别模型基于CTC算法进行语音序列的切分;所述语音识别模型基于注意力机制对切分的片段进行识别;S3:获取使用者的身份识别结果;采集使用者的声音信息获取与所述操作者相对应的语音特征参数;进而获得与之相匹配的身份识别结果;S4:获取待识别的语音信号;提取所述语音信号的特征,得到所述语音信号的特征序列;将所述特征序列输入至训练后的语音识别模型中进行语音识别。2.根据权利要求1所述的一种语音识别方法,其特征在于,所述语音识别方法还包括:判断环境状态;以及所述获取操作者的身份识别结果的步骤还包括:根据所述环境状态,获取操作者的身份识别结果。3.根据权利要求1所述的一种语音识别方法,其特征在于,所述语音特征参数包括:声学特征参数、声纹信息参数、语音的音色参数、音高参数、音长参数和音强参数。4.根据权利要求1所述的一种语音识别方法,其特征在于,所述S1步骤中对数据预处理即为对原始语音进行处理:对所述元时运银处理具体包括以下步骤:对所述原始语音进行预加重处理;对所述原始语音进行分帧处理;对所述原始语音进行加窗处理;对所述原始语音进行端点检测处理。5.一种语音识别装置,应用于语音识别模型,其特征在于,包括有语音获取模块、数据处理模块、特征提取模块、识别模块和检测模块,所述语音获取模块用于获取待识别的语音信号;所述特征提取模块,用于提取所述语音信号的特征,得到所述语音信号的特征序列;所述语音识别模块,用于将所述语音信号的特征输入至训练后的语音识别模型,以使得所述训练后的语音识别模型识别所述语音信号,得到所述语音识别模型输出的第一信号,所述第一信号用于表示所述语音信号的文字信息。6.根据权利要求5所述的一种语音识别装置,其特征在于,所述数据处理模块还被配置为:接收所述操作者的语音;向服务器发送所接收的语音;以及从服务器接收与所述操作者相对应的声学特征集,对声音信号进行处理并识别,用于在预设时段内未获得身份识别的结果时,发出身份识别提醒。7.根据权利要求6所述的一种语音识别装置,其特征在于,所述识别模块在根据所述语音特征参数对所述语音信息进行语音识别时,具体用于:获取所述语音信息中的语音特征参数;若获取到的语音特征参数与预设的使用者的语音特征参数相匹配,则根据所述预设的使用者的语音特征参数对所述语音信息进行语音识别。8.根据权利要求7所述的一种语音识别装置,其特征在于,所述检测模块用于检测并分析预设的数据处理模块,以获取使用者的语音特征参数,并将获取到的所述使用者的语音特征参数存储于语音识别模型中。9.根据权利要求7所述的一种语音识别装置,其特征在于,所述检测模块用于根据声学特征参数、声纹信息参数、语音的音色参数、音高参数、音长参数和音强参数或者它们的组合获取使用者