表情识别模型训练方法、装置、设备和存储介质-豆柴文库

表情识别模型训练方法、装置、设备和存储介质.pdf

2024-01-06

10金币

578KB

15页

映雁****魔王

实名认证

内容提供者

1/10

2/10

3/10

4/10

5/10

6/10

7/10

8/10

9/10

10/10

亲，该文档总共15页，到这已经超出免费预览范围，如果喜欢就直接下载吧～

下载提示文本预览

如果您无法下载资料，请参考说明：

1、部分资料下载需要金币，请确保您的账户上有足够的金币

2、已购买过的文档，再次下载不重复扣费

3、资料包下载后请先用软件解压，在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN110309713A(43)申请公布日2019.10.08(21)申请号201910427443.1(22)申请日2019.05.22(71)申请人深圳壹账通智能科技有限公司地址518052广东省深圳市前海深港合作区前湾一路A栋201室(72)发明人王丽杰(74)专利代理机构北京市京大律师事务所11321代理人刘挽澜(51)Int.Cl.G06K9/00(2006.01)G06K9/62(2006.01)权利要求书3页说明书9页附图2页(54)发明名称表情识别模型训练方法、装置、设备和存储介质(57)摘要本申请涉及人工智能技术领域，提供了表情识别模型训练方法、装置、设备和存储介质，方法包括：对原训练图像集合分别进行以下处理：降低原训练图像集合的分辨率，得到第一类训练图像集合；渲染原训练图像集合的背景光线，得到第二类训练图像集合；降低原训练图像集合的分辨率，并且渲染原训练图像集合的背景光线，得到第三类训练图像集合；通过原训练图像集合、第一类训练图像集合、第二类训练图像集合所述第三类训练图像集合训练表情识别模型。通过对原训练图像的清晰度或背景色调等特征进行调整，得到多类新的训练图像，新的训练图像无需再做人工打标处理，丰富了表情识别模型的训练样本图像集。CN110309713ACN110309713A权利要求书1/3页1.一种表情识别模型训练方法，其特征在于，包括：获取原训练图像集合；所述原训练图像集合包括多个已标注的原训练图像；对所述原训练图像集合分别进行以下处理：降低所述原训练图像集合中的各原训练图像的分辨率，得到第一类训练图像集合；渲染所述原训练图像集合中的各原训练图像的背景光线，得到第二类训练图像集合；降低所述原训练图像集合中的各原训练图像的分辨率，并且渲染各原训练图像的背景光线，得到第三类训练图像集合；分别通过所述原训练图像集合、所述第一类训练图像集合、所述第二类训练图像集合以及所述第三类训练图像集合训练表情识别模型。2.根据权利要求1所述的表情识别模型训练方法，其特征在于，在所述分别通过所述原训练图像集合、所述第一类训练图像集合、所述第二类训练图像集合以及所述第三类训练图像集合训练表情识别模型之后，所述方法还包括：获取原测试图像集合；所述原测试图像集合包括多个原测试图像；原测试图像用于测试训练后的表情识别模型对人脸图像识别的准确率；对所述原测试图像集合分别进行以下处理：降低所述原测试图像集合中的各原测试图像的分辨率，得到第一类测试图像集合；渲染所述原测试图像集合中的各原测试图像的背景光线，得到第二类测试图像集合；降低所述原测试图像集合中的各原测试图像的分辨率，并且渲染各原测试图像的背景光线，得到第三类测试图像集合；通过训练后的表情识别模型对所述原测试图像集合、所述第一类测试图像集合、所述第二类测试图像集合以及所述第三类测试图像集合进行识别；分别统计所述训练后的表情识别模型对所述原测试图像集合、所述第一类测试图像集合、所述第二类测试图像集合以及所述第三类测试图像集合识别的准确率。3.根据权利要求1所述的表情识别模型训练方法，其特征在于，采用深度神经网络模型降低所述原训练图像集合中的各原训练图像的分辨率；在所述获取原训练图像集合之前，所述方法还包括：以高分辨率子图像样本作为深度神经网络框架的输入样本，以低分辨率子图像样本作为所述深度神经网络框架的输出对比样本，生成所述深度神经网络模型；高分辨率子图像样本为低分辨率子图像样本分辨率转化后的图像。4.根据权利要求3所述的表情识别模型训练方法，其特征在于，在所述以高分辨率子图像样本作为深度神经网络框架的输入样本，以低分辨率子图像样本作为所述深度神经网络框架的输出对比样本，生成所述深度神经网络模型之前，所述方法还包括：将低分辨率图像样本分割为多个低分辨率子图像样本；采用图像转换算法对低分辨率子图像样本进行图像转换，得到低分辨率子图像样本对应的高分辨率子图像样本。5.根据权利要求4所述的表情识别模型训练方法，其特征在于，所述采用图像转换算法对低分辨率子图像样本进行图像转换，得到低分辨率子图像样本对应的高分辨率子图像样本，包括：2CN110309713A权利要求书2/3页采用图像全变分算法对低分辨率子图像样本进行分解，得到卡通子图像样本和纹理子图像样本；采用插值算法对所述卡通子图像样本进行放大，得到放大后的卡通子图像样本；采用同伦法对所述纹理子图像样本进行放大，得到放大后的纹理子图像样本；对所述放大后的卡通子图像样本和所述放大后的纹理子图像样本进行合成，得到高分辨率子图像样本。6.根据权利要求5所述的表情识别模型训练方法，其特征在于，所述图像全变分算法的表达式为：其中，(xp,yp)表示低分辨率子图像样本中当前

相关资料

表情识别模型训练方法、装置、设备和存储介质.pdf

本申请涉及人工智能技术领域，提供了表情识别模型训练方法、装置、设备和存储介质，方法包括：对原训练图像集合分别进行以下处理：降低原训练图像集合的分辨率，得到第一类训练图像集合；渲染原训练图像集合的背景光线，得到第二类训练图像集合；降低原训练图像集合的分辨率，并且渲染原训练图像集合的背景光线，得到第三类训练图像集合；通过原训练图像集合、第一类训练图像集合、第二类训练图像集合所述第三类训练图像集合训练表情识别模型。通过对原训练图像的清晰度或背景色调等特征进行调整，得到多类新的训练图像，新的训练图像无需再做人工打

2024-01-06

578KB

语音识别模型的训练方法、装置、设备及存储介质.pdf

本申请公开了一种语音识别模型的训练方法、装置、设备及存储介质,属于人工智能领域。所述方法包括:获取样本音频集,所述样本音频集中包括多个样本音频;基于初始语音识别模型,在所述样本音频集中筛选候选样本音频;在所述候选样本音频中提取音频片段;其中,所述音频片段包括所述候选样本音频中与连续相同文本单元对齐的音频;且,所述初始语音识别模型在对所述候选样本音频进行语音识别时,未正确识别所述连续相同文本单元;根据所述音频片段对所述初始语音识别模型进行再训练,得到目标语音识别模型。本申请能够提升语音识别质量,特别是提升了

2023-04-20

724KB

表情识别模型的训练方法、识别方法、装置、设备及介质.pdf

本公开涉及一种表情识别模型的训练方法及装置、表情识别方法及装置、电子设备及计算机可读介质，属于深度学习技术领域。该方法包括：获取人脸图像样本以及样本类型标签作为训练数据；获取卷积神经网络并进行特征提取得到样本特征；将卷积神经网络中的卷积层拆分为一条训练主路和多条训练支路，通过训练支路得到样本潜在类型的预测结果，并通过训练主路得到样本真实类型的预测结果；得到支路损失函数和主路损失函数；通过支路损失函数和主路损失函数对卷积神经网络中的神经网络参数进行迭代更新。本公开通过将卷积神经网络拆分为一条训练主路和多条训

2023-06-14

1.5MB

语音识别、网络模型的训练方法、装置、设备和存储介质.pdf

本申请提供了一种语音识别、网络模型的训练方法、装置、设备和存储介质，解决了现有技术中语音识别系统识别效果较差的问题。基于初始说话人波束和多路语音信号确定第一目标说话人波束，初始说话人波束基于多路语音信号的波束成形过程得到，第一目标说话人波束指示多路语音信号各自在初始说话人波束所在方向上的声音信息；基于第一目标说话人波束和多路语音信号确定噪声波束，噪声波束指示多路语音信号中除了第一目标说话人波束之外的声音信息；基于噪声波束和唤醒波束对第一目标说话人波束进行滤波，得到第二目标说话人波束，唤醒波束指示包含唤醒词

2023-07-24

1KB

语音识别模型训练方法、装置、设备、存储介质及产品.pdf

本申请公开了一种语音识别模型训练方法、装置、设备、存储介质及产品，属于互联网技术领域。该方法先获取多个非人声音频，通过第一语音识别模型对多个非人声音频进行识别，得到每个非人声音频对应的识别结果，基于该识别结果，确定被识别为人声音频的多个第一非人声音频，从多个第一非人声音频中，确定目标非人声音频，将目标非人声音频与不包含唤醒词的人声音频作为负样本，将包含唤醒词的人声音频作为正样本，基于负样本和正样本进行模型训练，得到用于识别唤醒词的第二语音识别模型。该第二语音识别模型在识别唤醒词时，可以消除与唤醒词相似的非

2023-07-24

818KB