一种语音识别方法和装置.pdf
一吃****仪凡
亲,该文档总共17页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
相关资料
一种语音识别方法和语音识别装置.pdf
本申请实施例提供一种语音识别方法和语音识别装置,该方法包括:对语音数据流进行加窗处理,确定位于窗口内的语音数据;对窗口内的语音数据进行对象识别处理,并根据对象识别处理结果对窗口进行长度调整,并将位于调整后的窗口内的语音数据确定为目标语音段;基于识别模型对目标语音段进行语音识别处理,得到目标识别结果。这样,在对语音数据流进行加窗处理时,根据对象识别处理的结果灵活调整窗口长度,以得到不同大小的目标语音段,能够兼顾识别速度和识别效果,从而综合改善端对端语音识别场景的语音识别性能。
一种语音识别方法和装置.pdf
本发明提供一种语音识别方法和装置,可以在没有网络的情况下识别用户输入的语音数据,并且识别结果更加准确。所述方法包括:获取用户输入的语音数据;确定是否可以通过预存储的本地语音库识别所述语音数据;若确定可以通过预存储的本地语音库识别所述语音数据,根据所述预存储的本地语音库识别所述语音数据。本发明适用于电子信息技术领域。
一种语音识别方法、装置和用于语音识别的装置.pdf
本发明实施例提供了一种语音识别方法、装置和用于语音识别的装置。所述方法包括:根据待处理的语音数据中各个说话人的声学特征,对所述语音数据进行切分处理,得到若干子句,每个子句包含一个说话人的语音片段;按照预设标签对所述子句进行归并处理,得到目标子句;对所述目标子句进行语音识别处理,得到所述语音数据的语音识别结果。本发明实施例可以保证每个子句的能量、说话人音调、音色的相对统一,有利于提升语音识别的准确度;并且,本发明实施例进一步还可以按照预设标签对子句进行归并处理,将存在关联关系的子句合并为目标子句,再对目标子
语音识别方法和装置.pdf
本发明公开了一种语音识别方法和装置,该方法和装置通过在语音信号中提取多个语音数据包,对每个语音数据包进行语音识别,并根据前一语音数据包的语速来生成后一语音数据包的语音识别过程所需提取语音特征向量的数量,无需获取完整的语音信号即可实现根据语音信号的语速变化来调整语音识别进程,使得语音识别效率和准确性均达到很高水准。
语音识别方法和装置.pdf
本申请公开了一种语音识别方法和装置,可应用于人工智能领域或者金融领域,该方法包括:获得待识别的语音信号;提取语音信号的声纹特征;基于语音信号的声纹特征,利用语音识别模型确定语音信号的分类识别结果,语音识别模型为基于至少一个用户各自的至少一个声纹特征样本训练得到的,其中,语音识别模型包括小波径向基神经网络模型和分类层,小波径向基神经网络模型包括:墨西哥帽小波函数以及径向基函数神经网络;基于分类识别结果,确定语音信号所归属的目标用户,目标用户属于至少一个用户。本申请的方案能够更为准确的确定出语音信号所归属的用