检测模型训练方法、语音对话检测方法及相关设备-豆柴文库

检测模型训练方法、语音对话检测方法及相关设备.pdf

2023-07-24

10金币

606KB

18页

梦影****主a

实名认证

内容提供者

1/10

2/10

3/10

4/10

5/10

6/10

7/10

8/10

9/10

10/10

亲，该文档总共18页，到这已经超出免费预览范围，如果喜欢就直接下载吧～

下载提示文本预览

如果您无法下载资料，请参考说明：

1、部分资料下载需要金币，请确保您的账户上有足够的金币

2、已购买过的文档，再次下载不重复扣费

3、资料包下载后请先用软件解压，在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN114155859A(43)申请公布日2022.03.08(21)申请号202010829628.8G10L25/51(2013.01)(22)申请日2020.08.18G10L25/30(2013.01)H04M3/51(2006.01)(71)申请人马上消费金融股份有限公司地址404100重庆市渝北区黄山大道中段52号渝兴广场B2栋4至8楼(72)发明人杜冰竹冯月赵立军蒋宁王洪斌吴海英(74)专利代理机构北京银龙知识产权代理有限公司11243代理人许静黄灿(51)Int.Cl.G10L15/26(2006.01)G10L15/06(2013.01)G10L15/16(2006.01)G10L15/18(2013.01)权利要求书2页说明书12页附图3页(54)发明名称检测模型训练方法、语音对话检测方法及相关设备(57)摘要本发明提供一种检测模型训练方法、语音对话检测方法及相关设备，该方法包括：构建待训练对话文本检测模型，所述待训练对话文本检测模型包括输入网络层、共享网络层和N个独占网络层，每一所述独占网络层与一个检测任务对应，N为正整数；利用目标文本以及N个检测任务对应的字段信息对所述待训练对话文本检测模型进行训练得到所述对话文本检测模型，所述N个检测任务各不相同。本发明实施例降低了语音检测的成本。CN114155859ACN114155859A权利要求书1/2页1.一种对话文本检测模型训练方法，其特征在于，所述方法包括：构建待训练对话文本检测模型，所述待训练对话文本检测模型包括输入网络层、共享网络层和N个独占网络层，每一所述独占网络层与一个检测任务对应，N为正整数；利用目标文本以及N个检测任务对应的字段信息对所述待训练对话文本检测模型进行训练得到所述对话文本检测模型，所述N个检测任务各不相同；其中，所述输入网络层的输入为所述目标文本以及N个检测任务对应的字段信息；所述共享网络层的输入为所述输入网络层输出的第一输出结果，所述独占网络层的输入为所述共享网络层的输出结果以及所述输入网络层输出的第二输出结果，每一所述独占网络层的输出结果为与所述独占网络层对应的检测任务的检测结果，所述第二输出结果为所述输入网络层基于所述检测任务输出的结果。2.根据权利要求1所述的方法，其特征在于，所述利用目标文本以及N个检测任务对应的字段信息对所述待训练对话文本检测模型进行训练得到所述对话文本检测模型包括：将所述目标文本以及N个检测任务对应的字段信息输入所述输入网络层，所述输入网络层输出所述目标文本对应的文本向量、位置向量得到所述第一输出结果，并输出所述N个检测任务对应的字段特征得到所述第二输出结果，其中，所述文本向量用于表示所述目标文本中每一个分词对应的嵌入向量，所述位置向量用于表示所述目标文本中每一个分词在所述目标文本中的位置信息；所述共享网络层对输入的所述文本向量以及位置向量进行相加后的信息进行编码，获得目标文本对应的编码信息；每一所述独占网络层利用对应的注意力机制对所述编码信息进行池化，得到每一所述独占网络层对应的检测任务的语义信息；每一所述独占网络层将对应的语义信息和对应的所述字段特征进行拼接后，输入到全连接神经网络进行分类，得到所述检测任务对应的检测结果。3.根据权利要求2所述的方法，其特征在于，所述输入网络层包括预训练的语言模型，所述输入网络层输出所述目标文本对应的文本向量包括：基于预设的分词表对所述目标文本进行分词处理，得到目标词汇表；根据预设的映射表对所述目标词汇表进行转换，获得基于索引表示的文本索引集，所述映射表包括词表中各分词与索引的对应关系；将所述文本索引集输入至所述预训练的语言模型，得到所述文本向量。4.根据权利要求3所述的方法，其特征在于，所述输入网络层输出所述目标文本对应的位置向量包括：在基于预设的分词表对所述目标文本进行分词处理，得到目标词汇表之后，根据正余弦函数计算所述目标文本中各分词的位置向量。5.根据权利要求2所述的方法，其特征在于，每一所述独占网络层包括Attenion层，每一所述独占网络层对应的注意力机制对所述编码信息进行池化，得到每一所述独占网络层对应的检测任务的语义信息的步骤，包括：接收所述编码信息；利用所述Attenion层的所述注意力机制，确定各时间步的权重信息，其中，不同的所述检测任务对应的各时间步的权重信息不同，每一时间步对应一个所述分词的权重；2CN114155859A权利要求书2/2页基于所述权重信息，对所述目标文本进行加权求和，得到每一所述独占网络层对应的检测任务对应的语义信息。6.一种语音对话检测方法，其特征在于，包括：将待检测的语音对话转换为目标对话文本；将所述目标对话文本以及M个检测任务对应的字段信息输入

相关资料

检测模型训练方法、语音对话检测方法及相关设备.pdf

本发明提供一种检测模型训练方法、语音对话检测方法及相关设备，该方法包括：构建待训练对话文本检测模型，所述待训练对话文本检测模型包括输入网络层、共享网络层和N个独占网络层，每一所述独占网络层与一个检测任务对应，N为正整数；利用目标文本以及N个检测任务对应的字段信息对所述待训练对话文本检测模型进行训练得到所述对话文本检测模型，所述N个检测任务各不相同。本发明实施例降低了语音检测的成本。

2023-07-24

606KB

语音内容检测方法、模型训练方法及相关装置.pdf

本申请提出一种语音内容检测方法、模型训练方法、装置、电子设备及存储介质，该方法包括：将目标语音的音频数据以及所述目标语音对应的视频数据，输入预先训练的多模态音频帧分类网络，得到对所述目标语音的各个音频帧的分类结果；其中，所述目标语音对应的视频数据中包含所述目标语音的说话人的面部影像；所述多模态音频帧分类网络，是与辅助训练网络联合训练得到的、用于将音频帧分类为语音帧或非语音帧的神经网络；在所述联合训练过程中，所述辅助训练网络以语音训练样本的文本标签为训练标签，对语音训练样本进行语音内容识别训练。上述方法能够

2023-07-21

731KB

语音顺滑模型训练方法、语音顺滑方法及相关设备.pdf

本申请公开了一种语音顺滑模型的训练方法、语音顺滑方法及相关设备，该方法通过语音顺滑模型中的编码网络和第一解码网络对样本语音数据进行语音识别预测，得到预测文本识别结果；获取编码网络输出的第一隐特征以及第一解码网络输出的第二隐特征，通过语音顺滑模型中的第二解码网络对该第一隐特征和第二隐特征进行语音顺滑预测，得到预测顺滑结果。基于各个预测结果所构建的总损失函数来训练语音顺滑模型，获得经训练的语音顺滑模型。从而在利用了原始语音信息的同时，也完整的保留了说话人的发音习惯等个人信息，减少了语音识别的误判，提高语音顺滑

2023-06-11

951KB

语音增强模型训练方法、语音增强方法、相关设备及介质.pdf

本公开关于一种语音增强模型训练方法、语音增强方法、相关设备及介质。训练方法包括：基于三维声场麦克风采集的三维扫频信号，确定三维房间冲激响应；将单通道纯净时域语音信号和时域噪声信号分别与三维房间冲激响应进行卷积，得到纯净时域三维语音信号和时域三维噪声信号；基于预设信噪比对纯净时域三维语音信号和时域三维噪声信号进行混合处理，得到样本含噪时域三维语音信号；将样本含噪时域三维语音信号的复数谱输入到语音增强模型中，得到单通道预估增强复数谱；基于单通道预估增强复数谱对应的预估时域信号和单通道纯净时域语音信号，确定语音

2023-07-24

1MB

语音增强方法、模型训练方法以及相关设备.pdf

本公开提供一种语音增强方法、模型训练方法以及相关设备。语音增强模型包括语音预测神经网络模块、噪声估计神经网络模块以及线性滤波模块，模型训练方法包括：获取训练集中各语音对的带噪语音幅度谱以及纯净语音幅度谱；根据带噪语音幅度谱获得第一特征集以及第二特征集；将第一特征集输入语音预测神经网络模块，以输出第一准估计纯净语音幅度谱以及预测误差；将第二特征集输入噪声估计神经网络模块，以输出估计噪声能量；将第一准估计纯净语音幅度谱、预测误差、估计噪声能量输入线性滤波模块，线性滤波模块用于输出估计纯净语音幅度谱；根据纯净语

2023-06-14

947KB