预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共14页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN105895089A(43)申请公布日2016.08.24(21)申请号201511027242.0(22)申请日2015.12.30(71)申请人乐视致新电子科技(天津)有限公司地址300467天津市滨海新区生态城动漫中路126号动漫大厦B1区二层201-427(72)发明人王育军侯锐(74)专利代理机构上海晨皓知识产权代理事务所(普通合伙)31260代理人成丽杰(51)Int.Cl.G10L15/14(2006.01)权利要求书2页说明书8页附图3页(54)发明名称一种语音识别方法及装置(57)摘要本发明涉及语音技术,公开了一种语音识别方法及装置。本发明中,预先根据通过模型训练得到的N个高斯进行软性聚类计算,得到M个软聚类高斯;在进行语音识别时,将语音转换得到特征向量,并根据该特征向量计算得分最高的前L个软聚类高斯,其中L小于M;将L个软聚类高斯内的各成员高斯,作为语音识别过程中声学模型里需要参与计算的高斯,进行声学模型似然度的计算。本发明提供的方法在语音识别的时候采用动态高斯选择的方式,减少识别过程中声学模型里需要评估的高斯个数,提高了声学模型似然度评估的速度和准确性。CN105895089ACN105895089A权利要求书1/2页1.一种语音识别方法,其特征在于,包含以下步骤:预先根据通过模型训练得到的N个高斯,进行软性聚类计算,得到M个软聚类高斯;在进行语音识别时,将语音转换得到特征向量,并根据所述特征向量计算出得分最高的前L个软聚类高斯,所述L小于所述M;将所述L个软聚类高斯内的各成员高斯,作为语音识别过程中声学模型里需要参与计算的高斯,进行声学模型似然度的计算。2.根据权利要求1所述的语音识别方法,其特征在于,所述根据通过模型训练得到的N个高斯,进行软性聚类计算的步骤中,包含以下子步骤:将所述N个高斯按预设权重分配给聚类高斯;根据各高斯对所属的各聚类高斯的更新权重,重新估计聚类高斯,得到所述M个软聚类高斯。3.根据权利要求2所述的语音识别方法,其特征在于,所述根据通过模型训练得到的N个高斯,进行软性聚类计算的步骤中,采用以下任意算法,进行所述软性聚类的计算:K均值算法、C均值算法、自组织图算法。4.根据权利要求3所述的语音识别方法,其特征在于,在采用K均值算法重新估计聚类高斯时,计算各聚类高斯的最小聚类代价;对所述最小聚类代价求导,获取每个成员高斯对每个聚类高斯的更新权重;根据获取到的每个成员高斯对每个聚类高斯的更新权重,计算各聚类高斯的均值和方差,得到所述重新估计的聚类高斯;将所述重新估计的聚类高斯,作为所述M个软聚类高斯。5.根据权利要求4所述的语音识别方法,其特征在于,根据以下公式计算所述最小聚类代价Q:其中,g(i,n)表示第n个高斯对第i个聚类高斯的更新权重;γ为预设的聚类软硬度参数;WSKLD表示作为高斯之间距离判据的加权对称KL散度。6.根据权利要求1所述的语音识别方法,其特征在于,所述L的取值为满足下列条件的最小值:其中,p(Gi|Y)≥p(Gi+1|Y)所述Y表示所述特征向量,其中α是一个对高斯的后验概率的压缩指数,Gi表示第i个聚类高斯,p(Gi|Y)表示第i个聚类高斯的后验概率。7.根据权利要求1所述的语音识别方法,其特征在于,所述根据特征向量计算出得分最高的前L个软聚类高斯的步骤中,包含以下子步骤:根据以下公式,获取各软聚类高斯的得分:2CN105895089A权利要求书2/2页所述Y表示所述特征向量,μm表示第m个软聚类高斯的均值,Σm表示第m个软聚类高斯的方差。8.根据权利要求1所述的语音识别方法,其特征在于,在所述将语音转换得到特征向量的步骤中,将每个语音帧转换为一个所述特征向量。9.一种语音识别装置,其特征在于,包含:软性聚类获取模块,用于根据通过模型训练得到的N个高斯,进行软性聚类计算,得到M个软聚类高斯;向量转换模块,用于在进行语音识别时,将语音转换得到特征向量;选择模块,用于根据所述特征向量计算出得分最高的前L个软聚类高斯,并将所述前L个软聚类高斯的各成员高斯,作为选择的高斯;所述L小于所述M;计算模块,用于将所述选择模块选择的高斯,作为语音识别过程中声学模型里需要参与计算的高斯,进行声学模型似然度的计算。10.根据权利要求9所述的语音识别装置,其特征在于,所述软性聚类获取模块包含:权重分配模块,用于将所述N个高斯按预设权重分配给聚类高斯;重估计模块,用于根据各高斯对所属的各聚类高斯的更新权重,重新估计聚类高斯,得到所述M个软聚类高斯。3CN105895089A说明书1/8页一种语音识别方法及装置技术领域[0001]本发明涉及语音技术,特别涉及一种语音识别方法。背景技术[0002]随着语音识别技术