用于语音识别的语言模型的训练、语音识别方法及装置-豆柴文库

用于语音识别的语言模型的训练、语音识别方法及装置.pdf

2023-07-24

10金币

913KB

27页

是笛****加盟

实名认证

内容提供者

1/10

2/10

3/10

4/10

5/10

6/10

7/10

8/10

9/10

10/10

亲，该文档总共27页，到这已经超出免费预览范围，如果喜欢就直接下载吧～

下载提示文本预览

如果您无法下载资料，请参考说明：

1、部分资料下载需要金币，请确保您的账户上有足够的金币

2、已购买过的文档，再次下载不重复扣费

3、资料包下载后请先用软件解压，在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN114299920A(43)申请公布日2022.04.08(21)申请号202111021975.9(22)申请日2021.09.01(71)申请人腾讯科技（深圳）有限公司地址518057广东省深圳市南山区高新区科技中一路腾讯大厦35层(72)发明人张一珂马龙(74)专利代理机构深圳翼盛智成知识产权事务所(普通合伙)44300代理人李汉亮(51)Int.Cl.G10L15/00(2013.01)G10L15/02(2006.01)G10L15/06(2013.01)G10L15/26(2006.01)G06F16/35(2019.01)权利要求书3页说明书18页附图5页(54)发明名称用于语音识别的语言模型的训练、语音识别方法及装置(57)摘要本申请公开了一种用于语音识别的语言模型的训练、语音识别方法及装置，涉及人工智能及地图车联技术领域，该方法包括：对文本数据集中的语句进行领域分类处理，得到至少一个语句集；对每个语句集进行权重评估，以基于每个语句集的权重确定符合预定重要性条件的目标语句集；基于目标语句集对应的语句数目及权重进行计算处理，得到采样数目；根据采样数目及语句集的权重进行采样概率分配处理，得到每个语句集中语句的采样概率；从每个语句集中按照对应采样概率进行语句抽取，生成训练语句集；基于训练语句集对语言模型进行训练。本申请提升用于语音识别的语言模型对于数据稀疏领域的分析性能，且语言模型进行分析时不需要输入额外特征及领域信息。CN114299920ACN114299920A权利要求书1/3页1.一种用于语音识别的语言模型的训练方法，其特征在于，包括：对文本数据集中的语句进行领域分类处理，得到至少一个领域的语句集；对每个所述语句集进行权重评估，以基于每个所述语句集的权重确定符合预定重要性条件的目标语句集；基于所述目标语句集对应的语句数目及权重进行计算处理，得到用于训练语言模型的语句的采样数目；根据所述采样数目及每个所述语句集的权重进行采样概率分配处理，得到每个所述语句集中语句的采样概率；从每个所述语句集中按照对应采样概率进行语句抽取，生成训练语句集；基于所述训练语句集对所述语言模型进行训练，得到训练后语言模型。2.根据权利要求1所述的方法，其特征在于，所述对每个所述语句集进行权重评估，以基于每个所述语句集的权重确定符合预定重要性条件的目标语句集，包括：基于每个领域的所述语句集对目标文法模型进行训练，得到每个领域对应的领域文法模型；采用每个所述领域文法模型对验证数据集中的每个词进行关联出现概率分析，得到每个所述领域文法模型输出的关联出现概率；基于每个所述领域文法模型输出的关联出现概率进行期望最大化权重插值处理，得到每个所述语句集的权重；基于所述权重确定符合预定重要性条件的目标语句集。3.根据权利要求2所述的方法，其特征在于，所述基于所述权重确定符合预定重要性条件的目标语句集，包括：确定权重最大的预定数目个所述语句集为候选语句集，或确定权重大于预定阈值的至少一个所述语句集为候选语句集；从所述候选语句集中确定包含语句的个数最大的语句集，作为所述目标语句集。4.根据权利要求1所述的方法，其特征在于，所有所述语句集的权重之和等于一；所述基于所述目标语句集对应的语句数目及权重进行计算处理，得到用于训练语言模型的语句的采样数目，包括：计算所述目标语句集对应的语句数目及权重的整数比值；将所述整数比值确定为从所有所述语句集中采集用于训练语言模型的语句的采样数目。5.根据权利要求1所述的方法，其特征在于，所述根据所述采样数目及每个所述语句集的权重进行采样概率分配处理，得到每个所述语句集中语句的采样概率，包括：计算每个所述语句集的权重与所有所述语句集的权重之和的权重比值，得到每个语句集对应的权重比值；计算每个所述语句集对应的权重比值与所述采样数目的乘积，作为每个所述语句集对应的语句采样数；基于每个所述语句集对应的语句采样数与语句数目进行比值计算，以确定每个所述语句集中语句的采样概率。6.根据权利要求5所述的方法，其特征在于，所述基于每个所述语句集对应的语句采样2CN114299920A权利要求书2/3页数与语句数目进行比值计算，以确定每个所述语句集中语句的采样概率，包括：针对每个所述语句集，当所述语句集对应的语句采样数小于语句数目时，计算所述语句集对应的语句采样数与语句数目的个数比；当所述语句集对应的语句采样数大于或等于语句数目时，对所述语句集中进行语句复制扩充处理，并计算所述语句集对应的语句采样数与扩充后语句数目的个数比；将每个所述语句集对应的个数比，作为每个所述语句集中语句的采样概率。7.根据权利要求6所述的方法，其特征在于，所述从每个所述语句集中按照对应采样概率进

相关资料

用于语音识别的语言模型的训练、语音识别方法及装置.pdf

本申请公开了一种用于语音识别的语言模型的训练、语音识别方法及装置，涉及人工智能及地图车联技术领域，该方法包括：对文本数据集中的语句进行领域分类处理，得到至少一个语句集；对每个语句集进行权重评估，以基于每个语句集的权重确定符合预定重要性条件的目标语句集；基于目标语句集对应的语句数目及权重进行计算处理，得到采样数目；根据采样数目及语句集的权重进行采样概率分配处理，得到每个语句集中语句的采样概率；从每个语句集中按照对应采样概率进行语句抽取，生成训练语句集；基于训练语句集对语言模型进行训练。本申请提升用于语音识别

2023-07-24

913KB

一种语音识别方法、装置和用于语音识别的装置.pdf

本发明实施例提供了一种语音识别方法、装置和用于语音识别的装置。所述方法包括：根据待处理的语音数据中各个说话人的声学特征，对所述语音数据进行切分处理，得到若干子句，每个子句包含一个说话人的语音片段；按照预设标签对所述子句进行归并处理，得到目标子句；对所述目标子句进行语音识别处理，得到所述语音数据的语音识别结果。本发明实施例可以保证每个子句的能量、说话人音调、音色的相对统一，有利于提升语音识别的准确度；并且，本发明实施例进一步还可以按照预设标签对子句进行归并处理，将存在关联关系的子句合并为目标子句，再对目标子

2023-07-25

534KB

用于语音识别的声学模型训练方法及装置.pdf

本发明实施例提供一种用于语音识别的声学模型训练方法及装置，所述方法包括：获取训练样本；所述训练样本包括声学特征以及所述声学特征对应的训练文本；获取原始声学模型，并利用所述原始声学模型，确定每一训练文本对应的所述原始声学模型中的声学状态；根据每一训练文本对应的声学状态以及声学特征，确定每一声学状态对应的声学特征；利用每一声学状态对应的声学特征，重新训练获得所述声学状态的状态描述模型；利用重新训练获得的状态描述模型，更新所述原始声学模型中的原始状态描述模型，获得更新之后的声学模型，本发明实施例降低了模型训练复

2023-12-07

428KB

语音识别模型的训练、语音识别方法、装置及设备.pdf

本申请实施例提供了一种语音识别模型的训练方法、语音识别方法、装置及设备。该方法包括：重复执行至少一个训练过程，直至第一文本数据的置信度满足停止训练条件，训练过程包括：将小语种音频数据输入至第一语音识别模型，得到第一文本数据，当第一文本数据的置信度不满足停止训练条件时，根据第一文本数据、对应的小语种音频数据以及第一样本数据，生成第二样本数据，将第二样本数据输入至第一语音识别模型，对第一语音识别模型进行训练，生成第二语音识别模型，并将第二语音识别模型作为第一语音识别模型；将第一文本数据的置信度满足停止训练条件

2023-07-25

944KB

语音识别模型的训练方法、语音识别方法及装置.pdf

本申请公开了一种语音识别模型的训练方法、语音识别方法及装置。语音识别模型的训练方法，包括：获取目标训练文本，其中，所述目标训练文本包括对将来的预设时间段内预测的目标场景对应的场景关键词；根据目标训练文本对初始语音识别模型进行更新训练，得到目标语音识别模型，其中，所述初始语音识别模型为已训练完成的语音识别模型。根据本申请实施例，能够解决语音识别效率低，识别准确性差的问题。

2023-07-24

429KB