表情识别模型的训练方法、识别方法、装置、设备及介质-豆柴文库

表情识别模型的训练方法、识别方法、装置、设备及介质.pdf

2023-06-14

10金币

1.5MB

30页

是你****优呀

实名认证

内容提供者

1/10

2/10

3/10

4/10

5/10

6/10

7/10

8/10

9/10

10/10

亲，该文档总共30页，到这已经超出免费预览范围，如果喜欢就直接下载吧～

下载提示文本预览

如果您无法下载资料，请参考说明：

1、部分资料下载需要金币，请确保您的账户上有足够的金币

2、已购买过的文档，再次下载不重复扣费

3、资料包下载后请先用软件解压，在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN112348001A(43)申请公布日2021.02.09(21)申请号202110022518.5G06N3/04(2006.01)(22)申请日2021.01.08(71)申请人北京沃东天骏信息技术有限公司地址100176北京市大兴区北京经济技术开发区科创十一街18号院2号楼4层A402室申请人北京京东世纪贸易有限公司(72)发明人胡一博佘加辉石海林梅涛周伯文(74)专利代理机构北京律智知识产权代理有限公司11438代理人孙宝海阚梓瑄(51)Int.Cl.G06K9/00(2006.01)G06K9/62(2006.01)权利要求书4页说明书19页附图6页(54)发明名称表情识别模型的训练方法、识别方法、装置、设备及介质(57)摘要本公开涉及一种表情识别模型的训练方法及装置、表情识别方法及装置、电子设备及计算机可读介质，属于深度学习技术领域。该方法包括：获取人脸图像样本以及样本类型标签作为训练数据；获取卷积神经网络并进行特征提取得到样本特征；将卷积神经网络中的卷积层拆分为一条训练主路和多条训练支路，通过训练支路得到样本潜在类型的预测结果，并通过训练主路得到样本真实类型的预测结果；得到支路损失函数和主路损失函数；通过支路损失函数和主路损失函数对卷积神经网络中的神经网络参数进行迭代更新。本公开通过将卷积神经网络拆分为一条训练主路和多条训练支路，并通过训练支路挖掘样本潜在类型信息，可以提高表情识别模型的识别准确率。CN112348001ACN112348001A权利要求书1/4页1.一种表情识别模型的训练方法，其特征在于，包括：获取人脸图像样本以及所述人脸图像样本对应的样本类型标签，并将所述人脸图像样本和所述样本类型标签作为表情识别模型的训练数据；获取用于训练所述表情识别模型的卷积神经网络，并通过所述卷积神经网络对所述人脸图像样本进行特征提取，得到所述人脸图像样本对应的样本特征；将所述卷积神经网络中的卷积层拆分为一条训练主路和多条训练支路，根据所述训练数据和所述样本特征，通过所述训练支路得到样本潜在类型的预测结果，并通过所述训练主路得到样本真实类型的预测结果；根据所述训练数据以及所述训练支路的预测结果得到支路损失函数，并根据所述训练数据以及所述训练主路和各个训练支路的预测结果得到主路损失函数；通过所述支路损失函数和所述主路损失函数对所述卷积神经网络中的神经网络参数进行迭代更新，以训练所述表情识别模型。2.根据权利要求1所述的表情识别模型的训练方法，其特征在于，所述将所述卷积神经网络中的卷积层拆分为一条训练主路和多条训练支路，包括：获取所述人脸图像样本对应的样本类型的数量，并根据所述样本类型的数量确定所述训练支路的数量；根据所述训练支路的数量将所述卷积神经网络中的卷积层拆分为一条训练主路和多条训练支路。3.根据权利要求1所述的表情识别模型的训练方法，其特征在于，所述根据所述训练数据和所述样本特征，通过所述训练支路得到样本潜在类型的预测结果，包括：对于每一条所述训练支路，分别将所述训练数据中与所述训练支路相对应的一个样本类型的训练数据和样本特征剔除，作为所述训练支路对应的支路反向训练数据；根据各个所述训练支路对应的支路反向训练数据分别对各个所述训练支路进行反向传播，得到所述训练支路的反向输出数据；获取与所述训练支路相对应的一个样本类型的所述训练数据和所述样本特征，作为所述训练支路对应的支路前向训练数据；根据所述训练支路对应的支路前向训练数据和所述训练支路的反向输出数据进行前向传播，得到所述训练支路对应的样本潜在类型的预测结果；其中，所述训练支路对应的样本潜在类型的预测结果为所述训练支路对应的样本类型的人脸图像样本属于其他样本类型的概率。4.根据权利要求1所述的表情识别模型的训练方法，其特征在于，所述支路损失函数包括支路交叉熵损失函数，所述根据所述训练数据以及所述训练支路的预测结果得到支路损失函数，包括：根据所述训练支路中各个所述样本类型的人脸图像样本的特征数据，以及所述训练支路的预测结果，计算所述训练支路中各个所述样本类型的样本交叉熵；对所述训练支路中各个所述样本类型的样本交叉熵求平均值，得到所述训练支路的支路交叉熵损失函数。5.根据权利要求1所述的表情识别模型的训练方法，其特征在于，所述主路损失函数包括主路均方误差损失函数，所述根据所述训练数据以及所述训练主路和各个训练支路的预2CN112348001A权利要求书2/4页测结果得到主路损失函数，包括：根据所述训练主路的预测结果与所述训练支路的预测结果之间的差值，得到预测误差；对所述训练主路中各个所述样本类型的预测误差的范数求平均值，得到所述训练主路的主路均方误差损失函数。6.根据权利要求1所述的表情识别模

相关资料

表情识别模型的训练方法、识别方法、装置、设备及介质.pdf

本公开涉及一种表情识别模型的训练方法及装置、表情识别方法及装置、电子设备及计算机可读介质，属于深度学习技术领域。该方法包括：获取人脸图像样本以及样本类型标签作为训练数据；获取卷积神经网络并进行特征提取得到样本特征；将卷积神经网络中的卷积层拆分为一条训练主路和多条训练支路，通过训练支路得到样本潜在类型的预测结果，并通过训练主路得到样本真实类型的预测结果；得到支路损失函数和主路损失函数；通过支路损失函数和主路损失函数对卷积神经网络中的神经网络参数进行迭代更新。本公开通过将卷积神经网络拆分为一条训练主路和多条训

2023-06-14

1.5MB

表情识别模型训练方法、装置、设备和存储介质.pdf

本申请涉及人工智能技术领域，提供了表情识别模型训练方法、装置、设备和存储介质，方法包括：对原训练图像集合分别进行以下处理：降低原训练图像集合的分辨率，得到第一类训练图像集合；渲染原训练图像集合的背景光线，得到第二类训练图像集合；降低原训练图像集合的分辨率，并且渲染原训练图像集合的背景光线，得到第三类训练图像集合；通过原训练图像集合、第一类训练图像集合、第二类训练图像集合所述第三类训练图像集合训练表情识别模型。通过对原训练图像的清晰度或背景色调等特征进行调整，得到多类新的训练图像，新的训练图像无需再做人工打

2024-01-06

578KB

模型训练方法、手势识别方法、装置、设备及介质.pdf

本申请公开了一种关节点旋转检测模型训练方法、装置、设备及介质，涉及图像处理技术领域，包括：获取人手图像数据，并提取第一手部关键点，以及利用反向动力学方法确定出各关节点的第一旋转轴角；将人手图像数据输入初始关节点旋转检测模型以输出六维旋转向量，并获取与六维旋转向量对应的第二旋转轴角；基于第一手部关键点和旋转矩阵确定出第二手部关键点；基于第一旋转轴角和第二旋转轴角以及基于第一手部关键点和第二手部关键点构建分别构建损失函数；利用总的损失函数对初始关节点旋转检测模型进行训练得到关节点旋转检测模型。通过构建关节点旋

2023-05-31

2.4MB

模型训练方法、文本识别方法、装置、设备和介质.pdf

本公开涉及模型训练方法、文本识别方法、装置、设备和介质，包括：利用第一训练样本训练第一候选模型中的第一候选分支和第二候选分支，得到训练后的第一目标分支，第一训练样本包括第一文本图像以及第一文本图像对应的文本字符，第二候选分支采用循环神经网络；基于训练后的第一目标分支和第三候选分支构建第二候选模型，并利用第二训练样本训练第二候选模型得到文本识别模型，第二训练样本包括第二文本图像以及第二文本图像对应的文本字符，第三候选分支采用图神经网络，实现快速准确的文本识别。

2023-07-25

828KB

语音识别方法、模型训练方法、装置、介质、电子设备.pdf

本公开的实施方式涉及计算机技术领域，更具体地，本公开的实施方式涉及语音识别方法、模型训练方法、装置、介质、电子设备。方法包括：将待识别音频数据输入至第一语音特征提取子模型，得到待识别音频数据的初始特征数据；将初始特征数据输入第二语音特征提取子模型中，第二语音特征提取子模型包括频域分支以及时域分支，频域分支用于输出待识别音频数据的频域特征数据，时域分支用于输出的待识别音频数据的时域特征数据；将频域特征数据和时域特征数据输入语音鉴伪子模型中，得到待识别音频数据的分类结果，分类结果用以指示待识别音频数据是否为真

2023-06-04

1KB