预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共21页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN114299571A(43)申请公布日2022.04.08(21)申请号202111573203.6(22)申请日2021.12.21(71)申请人广州虎牙科技有限公司地址511495广东省广州市番禺区钟村街(汉溪商业中心)泽溪街13号1301(72)发明人林哲韩欣彤卫华威(74)专利代理机构北京超凡宏宇专利代理事务所(特殊普通合伙)11463代理人张欣欣(51)Int.Cl.G06V40/16(2022.01)G06K9/62(2022.01)G06V10/764(2022.01)G06V10/774(2022.01)权利要求书2页说明书13页附图5页(54)发明名称基于平衡样本的模型训练方法、装置、电子设备和存储介质(57)摘要本申请提供一种基于平衡样本的模型训练方法、装置、电子设备和存储介质,根据多个训练样本的同一类表情系数计算得到累加系数,由多个累加系数构建累加向量。根据累加向量中的累加系数的分布确定目标累加系数,将目标累加系数的部分目标表情系数赋予第一权重,将其他表情系数赋予第二权重,得到由第一权重和第二权重构成的权重矩阵。以权重矩阵构成的损失函数的指导下对模型进行调整并继续训练,直到满足预设要求。本方案中,利用训练样本中表情系数的分布为表情系数赋以不同的权重,进而在包含权重的损失函数的指导下进行训练,使得训练依据的是样本中均匀的表情系数的信息,在符合真实场景的样本的基础上,优化模型训练效果。CN114299571ACN114299571A权利要求书1/2页1.一种基于平衡样本的模型训练方法,其特征在于,所述方法包括:获取多个训练样本,各所述训练样本具有标签向量,所述标签向量包含多个表情系数;根据所述多个训练样本的同一类表情系数计算得到累加系数,由得到的多个累加系数构建累加向量;根据所述累加向量中的累加系数的分布确定目标累加系数,并将目标累加系数的部分目标表情系数赋以第一权重,将其他表情系数赋以第二权重,得到由所有第一权重和第二权重构成的权重矩阵;利用所述多个训练样本对构建的模型进行训练,并在以所述权重矩阵构成的损失函数的指导下对模型进行调整并继续训练,直至满足预设要求时停止训练。2.根据权利要求1所述的基于平衡样本的模型训练方法,其特征在于,所述获取多个训练样本的步骤,包括:获取多个原始样本,针对所述多个原始样本中的每类表情系数,为该类表情系数构建初始状态为空的多个数组,各所述数组对应该类表情系数所属区间所划分的各个子区间;针对各类表情系数遍历各个原始样本,将各个原始样本分别放置于表情系数所属的子区间对应的数组内;针对各类表情系数,从对应的数组内选取原始样本以作为训练样本,直至得到预设数量的训练样本。3.根据权利要求2所述的基于平衡样本的模型训练方法,其特征在于,各类表情系数对应数组所属的子区间从小到大依次分布;所述针对各类表情系数,从对应的数组内选取原始样本以作为训练样本的步骤之前,所述获取多个训练样本的步骤还包括:针对各类表情系数,将对应的数组中所属子区间最小的数组删除;将多个数组中为空的数组删除。4.根据权利要求2所述的基于平衡样本的模型训练方法,其特征在于,所述针对各类表情系数,从对应的数组内选取原始样本以作为训练样本的步骤之前,所述获取多个训练样本的步骤还包括:针对每类表情系数,确定其对应的数组中包含原始样本数量小于设定数量的数组;将包含少于设定数量的原始样本的数组与其相邻的数组进行合并,以使合并后的数组中原始样本数量大于或等于所述设定数量。5.根据权利要求2所述的基于平衡样本的模型训练方法,其特征在于,所述针对各类表情系数,从对应的数组内选取原始样本以作为训练样本,直至得到预设数量的训练样本的步骤,包括:依次针对各类表情系数,依次从其对应的各个数组中选取一个原始样本,并检测选取的原始样本是否与当前已确定的训练样本中的任意一个重复,若重复则执行下一个数组的选取,若不重复则将选取的原始样本作为训练样本;在得到的训练样本的数量达到预设数量时,停止选取动作。6.根据权利要求5所述的基于平衡样本的模型训练方法,其特征在于,所述获取多个训练样本的步骤,还包括:将得到的各个数组进行复制,得到对应的复制数组;2CN114299571A权利要求书2/2页所述针对各类表情系数,从对应的数组内选取原始样本以作为训练样本,直至得到预设数量的训练样本的还步骤,包括:针对各类表情系数,若该类表情系数对应的数组中存在为空的数组,则将该数组对应的复制数组中的原始样本复制并放置于该数组中。7.根据权利要求1所述的基于平衡样本的模型训练方法,其特征在于,所述根据所述累加向量中的累加系数的分布确定目标累加系数的步骤,包括:比对所述累加向量中的累加系数的大小,确定满