一种用于语音识别方法及系统.pdf
一吃****新冬
亲,该文档总共18页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
相关资料
一种用于语音识别方法及系统.pdf
本发明实施例公开了一种用于语音识别的方法及系统,包括:从监听的语音信号中截取第一语音片段,对所述第一语音片段进行分析确定能量谱;依据所述能量谱对所述第一语音片段进行特征提取,确定语音特征;依据所述语音特征对所述第一语音片段的能量谱进行分析,截取第二段语音片段;对所述第二段语音片段进行语音识别,得到语音识别结果。通过实施上述方法,解决了现有技术中在离线状态下,识别功能单一、识别率低的问题。
用于车载的语音识别方法及系统.pdf
本发明实施例提供一种用于车载的语音识别方法。该方法包括:使用多个麦克风对车载空间进行音区信号分离,至少将车载空间分为多个音区,根据各音区内的麦克风组成分布式麦克风网络;通过分布式麦克风网络实时采集车载环境下的音频,根据回声消除算法抑制音频中的车载环境自噪声;通过盲源分离算法对抑制音频中多个说话人的声音进行分离;通过分布式麦克风网络定位每个说话人所在的音区,没有说话人发出的声音时,将声音采集为噪音估计,有说话人发出的声音时,根据前一帧采集的噪音估计进行降噪,确定出干净语音进行语音识别。本发明实施例还提供一种
一种语音识别方法及系统.pdf
本申请公开了一种语音识别方法及系统,获取原始语音信号,利用预设深度残差收缩网络模型中的深度残差收缩网络对待识别的原始语音信号进行滤除处理,得到目标语音频谱,从目标语音频谱中提取语音时序特征,通过深度残差收缩网络的预设分类层对语音时序特征进行分类,得到目标语音频谱对应的字符概率,通过预设预测模型对字符概率进行预测得到文本信息。通过上述,由于预设深度残差收缩网络模型中融入了残差模块和软阈值函数,因此具有特征提取能力强和去除噪声的特性,利用预设深度残差收缩网络模型中的深度残差收缩网络去除原始语音频谱所包含的无关
一种语音识别方法及系统.pdf
本发明涉及一种语音识别的技术领域,揭露了一种语音识别方法,包括:获取待识别语音信号,并计算待识别语音信号的能量密度谱;将能量密度谱进行伪彩色映射,得到待识别语音信号的彩色语谱图;利用自适应的时域滤波器对彩色语谱图中的语音信号进行回声消除;利用盲源分离算法估计待识别语音中目标语音信号的mask值;利用基于mask值的多通道增强算法对目标语音信号进行增强;利用预训练的DFSMN‑CTC模型对语音信号进行识别,得到语音识别结果。本发明还提出一种语音识别系统。本发明实现了语音的识别。
一种语音识别方法、装置和用于语音识别的装置.pdf
本发明实施例提供了一种语音识别方法、装置和用于语音识别的装置。所述方法包括:根据待处理的语音数据中各个说话人的声学特征,对所述语音数据进行切分处理,得到若干子句,每个子句包含一个说话人的语音片段;按照预设标签对所述子句进行归并处理,得到目标子句;对所述目标子句进行语音识别处理,得到所述语音数据的语音识别结果。本发明实施例可以保证每个子句的能量、说话人音调、音色的相对统一,有利于提升语音识别的准确度;并且,本发明实施例进一步还可以按照预设标签对子句进行归并处理,将存在关联关系的子句合并为目标子句,再对目标子