一种语音识别方法及装置-豆柴文库

一种语音识别方法及装置.pdf

2023-12-06

10金币

856KB

14页

慧颖****23

实名认证

内容提供者

1/10

2/10

3/10

4/10

5/10

6/10

7/10

8/10

9/10

10/10

亲，该文档总共14页，到这已经超出免费预览范围，如果喜欢就直接下载吧～

下载提示文本预览

如果您无法下载资料，请参考说明：

1、部分资料下载需要金币，请确保您的账户上有足够的金币

2、已购买过的文档，再次下载不重复扣费

3、资料包下载后请先用软件解压，在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN105895089A(43)申请公布日2016.08.24(21)申请号201511027242.0(22)申请日2015.12.30(71)申请人乐视致新电子科技（天津）有限公司地址300467天津市滨海新区生态城动漫中路126号动漫大厦B1区二层201-427(72)发明人王育军侯锐(74)专利代理机构上海晨皓知识产权代理事务所(普通合伙)31260代理人成丽杰(51)Int.Cl.G10L15/14(2006.01)权利要求书2页说明书8页附图3页(54)发明名称一种语音识别方法及装置(57)摘要本发明涉及语音技术，公开了一种语音识别方法及装置。本发明中，预先根据通过模型训练得到的N个高斯进行软性聚类计算，得到M个软聚类高斯；在进行语音识别时，将语音转换得到特征向量，并根据该特征向量计算得分最高的前L个软聚类高斯，其中L小于M；将L个软聚类高斯内的各成员高斯，作为语音识别过程中声学模型里需要参与计算的高斯，进行声学模型似然度的计算。本发明提供的方法在语音识别的时候采用动态高斯选择的方式，减少识别过程中声学模型里需要评估的高斯个数，提高了声学模型似然度评估的速度和准确性。CN105895089ACN105895089A权利要求书1/2页1.一种语音识别方法，其特征在于，包含以下步骤：预先根据通过模型训练得到的N个高斯，进行软性聚类计算，得到M个软聚类高斯；在进行语音识别时，将语音转换得到特征向量，并根据所述特征向量计算出得分最高的前L个软聚类高斯，所述L小于所述M；将所述L个软聚类高斯内的各成员高斯，作为语音识别过程中声学模型里需要参与计算的高斯，进行声学模型似然度的计算。2.根据权利要求1所述的语音识别方法，其特征在于，所述根据通过模型训练得到的N个高斯，进行软性聚类计算的步骤中，包含以下子步骤：将所述N个高斯按预设权重分配给聚类高斯；根据各高斯对所属的各聚类高斯的更新权重，重新估计聚类高斯，得到所述M个软聚类高斯。3.根据权利要求2所述的语音识别方法，其特征在于，所述根据通过模型训练得到的N个高斯，进行软性聚类计算的步骤中，采用以下任意算法，进行所述软性聚类的计算：K均值算法、C均值算法、自组织图算法。4.根据权利要求3所述的语音识别方法，其特征在于，在采用K均值算法重新估计聚类高斯时，计算各聚类高斯的最小聚类代价；对所述最小聚类代价求导，获取每个成员高斯对每个聚类高斯的更新权重；根据获取到的每个成员高斯对每个聚类高斯的更新权重，计算各聚类高斯的均值和方差，得到所述重新估计的聚类高斯；将所述重新估计的聚类高斯，作为所述M个软聚类高斯。5.根据权利要求4所述的语音识别方法，其特征在于，根据以下公式计算所述最小聚类代价Q：其中，g(i,n)表示第n个高斯对第i个聚类高斯的更新权重；γ为预设的聚类软硬度参数；WSKLD表示作为高斯之间距离判据的加权对称KL散度。6.根据权利要求1所述的语音识别方法，其特征在于，所述L的取值为满足下列条件的最小值：其中，p(Gi|Y)≥p(Gi+1|Y)所述Y表示所述特征向量，其中α是一个对高斯的后验概率的压缩指数，Gi表示第i个聚类高斯，p(Gi|Y)表示第i个聚类高斯的后验概率。7.根据权利要求1所述的语音识别方法，其特征在于，所述根据特征向量计算出得分最高的前L个软聚类高斯的步骤中，包含以下子步骤：根据以下公式，获取各软聚类高斯的得分：2CN105895089A权利要求书2/2页所述Y表示所述特征向量，μm表示第m个软聚类高斯的均值，Σm表示第m个软聚类高斯的方差。8.根据权利要求1所述的语音识别方法，其特征在于，在所述将语音转换得到特征向量的步骤中，将每个语音帧转换为一个所述特征向量。9.一种语音识别装置，其特征在于，包含：软性聚类获取模块，用于根据通过模型训练得到的N个高斯，进行软性聚类计算，得到M个软聚类高斯；向量转换模块，用于在进行语音识别时，将语音转换得到特征向量；选择模块，用于根据所述特征向量计算出得分最高的前L个软聚类高斯，并将所述前L个软聚类高斯的各成员高斯，作为选择的高斯；所述L小于所述M；计算模块，用于将所述选择模块选择的高斯，作为语音识别过程中声学模型里需要参与计算的高斯，进行声学模型似然度的计算。10.根据权利要求9所述的语音识别装置，其特征在于，所述软性聚类获取模块包含：权重分配模块，用于将所述N个高斯按预设权重分配给聚类高斯；重估计模块，用于根据各高斯对所属的各聚类高斯的更新权重，重新估计聚类高斯，得到所述M个软聚类高斯。3CN105895089A说明书1/8页一种语音识别方法及装置技术领域[0001]本发明涉及语音技术，特别涉及一种语音识别方法。背景技术[0002]随着语音识别技术

相关资料

一种语音识别方法及装置.pdf

本发明涉及语音技术，公开了一种语音识别方法及装置。本发明中，预先根据通过模型训练得到的N个高斯进行软性聚类计算，得到M个软聚类高斯；在进行语音识别时，将语音转换得到特征向量，并根据该特征向量计算得分最高的前L个软聚类高斯，其中L小于M；将L个软聚类高斯内的各成员高斯，作为语音识别过程中声学模型里需要参与计算的高斯，进行声学模型似然度的计算。本发明提供的方法在语音识别的时候采用动态高斯选择的方式，减少识别过程中声学模型里需要评估的高斯个数，提高了声学模型似然度评估的速度和准确性。

2023-12-06

856KB

一种语音识别方法及语音识别装置.pdf

本发明公开了一种语音识别方法及识别装置，具体包括以下步骤：S1：进行数据预处理，使用者首先根据其需求创建语音文件，所述语音文件包括语音数据预处理和文本数据预处理，其中所述语音数据预处理用于获取语音文件中的特征数据，所述文本数据预处理用于获取语音文件中的文本内容并提取其中出现的文字创建词典；S2：构建语音识别模型，其中所述语音识别模型基于CTC算法进行语音序列的切分。本发明提供的语音识别方法及语音识别装置具有充分提取语音数据的特征信息，同时该模型结构也采用了判断环境状态的技术，能够进一步简化语音识别的流程，

2023-06-11

285KB

一种语音识别方法和语音识别装置.pdf

本申请实施例提供一种语音识别方法和语音识别装置，该方法包括：对语音数据流进行加窗处理，确定位于窗口内的语音数据；对窗口内的语音数据进行对象识别处理，并根据对象识别处理结果对窗口进行长度调整，并将位于调整后的窗口内的语音数据确定为目标语音段；基于识别模型对目标语音段进行语音识别处理，得到目标识别结果。这样，在对语音数据流进行加窗处理时，根据对象识别处理的结果灵活调整窗口长度，以得到不同大小的目标语音段，能够兼顾识别速度和识别效果，从而综合改善端对端语音识别场景的语音识别性能。

2023-07-25

564KB

一种语音识别方法、装置和用于语音识别的装置.pdf

本发明实施例提供了一种语音识别方法、装置和用于语音识别的装置。所述方法包括：根据待处理的语音数据中各个说话人的声学特征，对所述语音数据进行切分处理，得到若干子句，每个子句包含一个说话人的语音片段；按照预设标签对所述子句进行归并处理，得到目标子句；对所述目标子句进行语音识别处理，得到所述语音数据的语音识别结果。本发明实施例可以保证每个子句的能量、说话人音调、音色的相对统一，有利于提升语音识别的准确度；并且，本发明实施例进一步还可以按照预设标签对子句进行归并处理，将存在关联关系的子句合并为目标子句，再对目标子

2023-07-25

534KB

一种语音识别方法和装置.pdf

本发明提供一种语音识别方法和装置，可以在没有网络的情况下识别用户输入的语音数据，并且识别结果更加准确。所述方法包括：获取用户输入的语音数据；确定是否可以通过预存储的本地语音库识别所述语音数据；若确定可以通过预存储的本地语音库识别所述语音数据，根据所述预存储的本地语音库识别所述语音数据。本发明适用于电子信息技术领域。

2024-01-03

1.9MB