预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共20页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN105989849A(43)申请公布日2016.10.05(21)申请号201510303746.4(22)申请日2015.06.03(71)申请人乐视致新电子科技(天津)有限公司地址300467天津市滨海新区生态城动漫中路126号动漫大厦B1区二层201-427(72)发明人王育军(74)专利代理机构北京国昊天诚知识产权代理有限公司11315代理人刘戈(51)Int.Cl.G10L21/0208(2013.01)G10L15/06(2013.01)权利要求书3页说明书12页附图4页(54)发明名称一种语音增强方法、语音识别方法、聚类方法及装置(57)摘要本发明公开一种语音增强方法、语音识别方法、聚类方法及装置。方法包括:选取与测试语音的第一帧语音部分的特征向量最匹配的特征向量聚类中心;针对测试语音包含的其他各帧语音部分的特征向量执行:从与该语音部分的前一帧语音部分的特征向量最匹配的特征向量聚类中心,以及与前一帧语音部分的特征向量最匹配的特征向量聚类中心相邻的特征向量聚类中心中,选取与该语音部分的特征向量最匹配的特征向量聚类中心;根据测试语音包含的各帧语音部分的特征向量、选取的特征向量聚类中心重建测试语音的特征向量。本发明由于在进行语音增强利用了能够表示语音连续性的特征,因此相比于现有技术中的传统的语音增强模型而言,能够达到更好的语音增强效果。CN105989849ACN105989849A权利要求书1/3页1.一种语音增强方法,其特征在于,包括:从训练得到的特征向量聚类中心中,选取与所述测试语音包含的第一帧语音部分的特征向量最匹配的特征向量聚类中心;针对所述测试语音包含的其他各帧语音部分的特征向量执行:从训练得到的、与该语音部分的前一帧语音部分的特征向量最匹配的特征向量聚类中心,以及与所述前一帧语音部分的特征向量最匹配的特征向量聚类中心相邻的特征向量聚类中心中,选取与该语音部分的特征向量最匹配的特征向量聚类中心;其中,训练得到的每个特征向量聚类中心与至少一个与其相邻的特征向量聚类中心构成的集合具有描述语音连续性的能力;根据所述测试语音包含的各帧语音部分的特征向量,以及选取的特征向量聚类中心,重建所述测试语音的特征向量。2.如权利要求1所述的方法,其特征在于,根据所述测试语音包含的各帧语音部分的特征向量,以及选取的特征向量聚类中心,重建所述测试语音的特征向量,包括:根据选取的特征向量聚类中心,执行对所述测试语音包含的所有语音部分的特征向量构成的向量集合的插值运算操作,以获得所述测试语音的重建的特征向量。3.如权利要求1所述的方法,其特征在于,从训练得到的特征向量聚类中心中,选取与所述测试语音包含的第一帧语音部分的特征向量最匹配的特征向量聚类中心前,所述方法还包括:从训练语料包含的各帧语音部分中分别提取特征向量样本;确定特征向量样本在多维空间中的分布信息;根据所述分布信息,确定初始聚类中心;根据所述特征向量样本与各初始聚类中心的相似度,对所述各初始聚类中心进行迭代聚类,得到待定聚类中心;根据设定的迭代聚类规则,对待定聚类中心进行迭代聚类,得到特征向量聚类中心;其中,所述设定的迭代聚类规则包括:根据所述训练语料的各语音部分的特征向量,对待定聚类中心进行迭代聚类;并且,在对待定聚类中心进行单次迭代聚类时依据的特征向量,为所述训练语料中单个语音部分的特征向量;在对待聚类中心进行的每相邻两次迭代聚类时分别依据的特征向量,是所述训练语料中相邻语音部分的特征向量。4.如权利要求3所述的方法,其特征在于,根据设定的迭代聚类规则,对待定聚类中心进行迭代聚类,得到特征向量聚类中心,包括:根据设定的迭代聚类规则,针对每个训练语料执行迭代聚类操作,直至满足迭代收敛条件时,将具备满足迭代收敛条件时计算出的参数值的各待定聚类中心,确定为特征向量聚类中心;其中,所述迭代聚类操作包括下述步骤:确定该训练语料的第一帧语音部分的特征向量与与该第一帧语音部分的特征向量最匹配的待定聚类中心的相似度,以及该第一帧语音部分的特征向量与该最匹配的待定聚类中心的相邻待定聚类中心的相似度;针对该训练语料的其他各帧语音部分,执行:从与该语音部分的前一相邻语音部分的特征向量最匹配的待定聚类中心,以及所述特定空间中与该语音部分的前一相邻语音部分的特征向量最匹配的待定聚类中心的相邻聚类中心中,确定与该语音部分最匹配的待定聚类中心,并确定该语音部分的特征向量与该最匹配的待定聚类中心的相似度,以及该语音2CN105989849A权利要求书2/3页部分的特征向量与该最匹配的待定聚类中心的相邻待定聚类中心的相似度;根据确定的各相似度,计算各待定聚类中心的参数值。5.一种语音识别方法,其特征在于,包括:对采用如权利要