预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共24页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN111862962A(43)申请公布日2020.10.30(21)申请号202010696240.5(22)申请日2020.07.20(71)申请人汪秀英地址410205湖南省长沙市高新开发区麓谷大道662号软件中心大楼308号(72)发明人汪秀英(74)专利代理机构长沙正务联合知识产权代理事务所(普通合伙)43252代理人郑隽吴婷(51)Int.Cl.G10L15/20(2006.01)G10L21/0208(2013.01)G10L21/0272(2013.01)G10L15/02(2006.01)G10L15/06(2013.01)权利要求书6页说明书15页附图2页(54)发明名称一种语音识别方法及系统(57)摘要本发明涉及一种语音识别的技术领域,揭露了一种语音识别方法,包括:获取待识别语音信号,并计算待识别语音信号的能量密度谱;将能量密度谱进行伪彩色映射,得到待识别语音信号的彩色语谱图;利用自适应的时域滤波器对彩色语谱图中的语音信号进行回声消除;利用盲源分离算法估计待识别语音中目标语音信号的mask值;利用基于mask值的多通道增强算法对目标语音信号进行增强;利用预训练的DFSMN‑CTC模型对语音信号进行识别,得到语音识别结果。本发明还提出一种语音识别系统。本发明实现了语音的识别。CN111862962ACN111862962A权利要求书1/6页1.一种语音识别方法,其特征在于,所述方法包括:获取待识别语音信号,并计算待识别语音信号的能量密度谱;将能量密度谱进行伪彩色映射,得到待识别语音信号的彩色语谱图;利用自适应的时域滤波器对彩色语谱图中的语音信号进行回声消除;利用盲源分离算法估计待识别语音中目标语音信号的mask值;利用基于mask值的多通道增强算法对目标语音信号进行增强;利用预训练的DFSMN-CTC模型对语音信号进行识别,得到语音识别结果。2.如权利要求1所述的一种语音识别方法,其特征在于,所述计算待识别语音信号的能量密度谱,包括:1)对待识别语音信号进行短时傅里叶变换:其中:x(n)为待识别语音的离散时域采样信号,n=0,1,...,N-1,n为时域采样点信号,N为语音信号的长度;Xn(m)为待识别语音离散时域采样信号的短时傅里叶变换结果;m为帧同步的时间信号,m=0,1,...,M-1,M为帧长;ω为窗序列;2)采用离散傅里叶变换DFT得:其中:0≤k≤N-1,k为待识别语音的离散时域采样信号的幅度值;X(n,k)为待识别语音的离散时域采样信号的短时幅度谱估计;Xn(m)为待识别语音离散时域采样信号的短时傅里叶变换结果;m为帧同步信号,m=0,1,...,M-1,M为帧长;N为语音信号的长度;3)计算时间m处的频谱能量密度函数:P(n,k)=|X(n,k)|2=(X(n,k))×(conj(X(n,k)))其中:X(n,k)为待识别语音的离散时域采样信号的短时幅度谱估计;n为时域采样点信号;k为待识别语音的离散时域采样信号的幅度值;conj(·)函数用于计算复数的共轭值;P(n,k)为信号x(n)的短时自相关函数的傅里叶变换,是二维的非负实值函数;用时间n作为横坐标,k作为纵坐标,将P(n,k)的值表示为灰度级所构成的二维图像就是能量密度谱;通过变换101gP(n,k)得到语谱图的dB表示。2CN111862962A权利要求书2/6页3.如权利要求2所述的一种语音识别方法,其特征在于,所述将能量密度谱进行伪彩色映射,包括:1)将P(n,k)的最大值Pmax(n,k)映射为归一化1电平,将最小值Pmin(n,k)映射为归一化0电平;2)将P(n,k)线性映射为0~1间的电平Li,计算机监视器根据Li的值将能量密度谱以伪彩色模式显示出来;3)选择基准电平值Base,将小于Base的值限定在此基准电平上,将大于Base的值线性映射到0~1的归一化彩色值,则彩色矩阵值L={l(n,k)}的数学表示为:其中:Base为基准电平值,本发明将其设为0;n为时域采样点信号;k为待识别语音的离散时域采样信号的幅度值;P(n,k)为信号x(n)的短时自相关函数的傅里叶变换,是二维的非负实值函数。4.如权利要求3所述的一种语音识别方法,其特征在于,所述自适应的时域滤波器为:所述时域滤波器的结构为频域分块自适应滤波器的结构,时域滤波器的系数向量可表TT示为w(n)=[w0(n),...,wM-1(n)],时域滤波器的误差向量为e(n)=[e(n),...e(n+M-1)],时域滤波器的滤波器系数W(k)和误差信号向量E(k)分别为:TTW(k)=[w0(k),...,w2M-1(k)]=F[w(kM)0...0]E(k)=F[0...0e(kM)]T其