表情识别模型训练方法、装置、设备和存储介质.pdf
映雁****魔王
亲,该文档总共15页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
相关资料
表情识别模型训练方法、装置、设备和存储介质.pdf
本申请涉及人工智能技术领域,提供了表情识别模型训练方法、装置、设备和存储介质,方法包括:对原训练图像集合分别进行以下处理:降低原训练图像集合的分辨率,得到第一类训练图像集合;渲染原训练图像集合的背景光线,得到第二类训练图像集合;降低原训练图像集合的分辨率,并且渲染原训练图像集合的背景光线,得到第三类训练图像集合;通过原训练图像集合、第一类训练图像集合、第二类训练图像集合所述第三类训练图像集合训练表情识别模型。通过对原训练图像的清晰度或背景色调等特征进行调整,得到多类新的训练图像,新的训练图像无需再做人工打
语音识别模型的训练方法、装置、设备及存储介质.pdf
本申请公开了一种语音识别模型的训练方法、装置、设备及存储介质,属于人工智能领域。所述方法包括:获取样本音频集,所述样本音频集中包括多个样本音频;基于初始语音识别模型,在所述样本音频集中筛选候选样本音频;在所述候选样本音频中提取音频片段;其中,所述音频片段包括所述候选样本音频中与连续相同文本单元对齐的音频;且,所述初始语音识别模型在对所述候选样本音频进行语音识别时,未正确识别所述连续相同文本单元;根据所述音频片段对所述初始语音识别模型进行再训练,得到目标语音识别模型。本申请能够提升语音识别质量,特别是提升了
表情识别模型的训练方法、识别方法、装置、设备及介质.pdf
本公开涉及一种表情识别模型的训练方法及装置、表情识别方法及装置、电子设备及计算机可读介质,属于深度学习技术领域。该方法包括:获取人脸图像样本以及样本类型标签作为训练数据;获取卷积神经网络并进行特征提取得到样本特征;将卷积神经网络中的卷积层拆分为一条训练主路和多条训练支路,通过训练支路得到样本潜在类型的预测结果,并通过训练主路得到样本真实类型的预测结果;得到支路损失函数和主路损失函数;通过支路损失函数和主路损失函数对卷积神经网络中的神经网络参数进行迭代更新。本公开通过将卷积神经网络拆分为一条训练主路和多条训
语音识别、网络模型的训练方法、装置、设备和存储介质.pdf
本申请提供了一种语音识别、网络模型的训练方法、装置、设备和存储介质,解决了现有技术中语音识别系统识别效果较差的问题。基于初始说话人波束和多路语音信号确定第一目标说话人波束,初始说话人波束基于多路语音信号的波束成形过程得到,第一目标说话人波束指示多路语音信号各自在初始说话人波束所在方向上的声音信息;基于第一目标说话人波束和多路语音信号确定噪声波束,噪声波束指示多路语音信号中除了第一目标说话人波束之外的声音信息;基于噪声波束和唤醒波束对第一目标说话人波束进行滤波,得到第二目标说话人波束,唤醒波束指示包含唤醒词
语音识别模型训练方法、装置、设备、存储介质及产品.pdf
本申请公开了一种语音识别模型训练方法、装置、设备、存储介质及产品,属于互联网技术领域。该方法先获取多个非人声音频,通过第一语音识别模型对多个非人声音频进行识别,得到每个非人声音频对应的识别结果,基于该识别结果,确定被识别为人声音频的多个第一非人声音频,从多个第一非人声音频中,确定目标非人声音频,将目标非人声音频与不包含唤醒词的人声音频作为负样本,将包含唤醒词的人声音频作为正样本,基于负样本和正样本进行模型训练,得到用于识别唤醒词的第二语音识别模型。该第二语音识别模型在识别唤醒词时,可以消除与唤醒词相似的非