神经网络训练方法、装置、设备和存储介质-豆柴文库

神经网络训练方法、装置、设备和存储介质.pdf

2024-01-10

10金币

1MB

22页

一吃****仪凡

实名认证

内容提供者

1/10

2/10

3/10

4/10

5/10

6/10

7/10

8/10

9/10

10/10

亲，该文档总共22页，到这已经超出免费预览范围，如果喜欢就直接下载吧～

下载提示文本预览

如果您无法下载资料，请参考说明：

1、部分资料下载需要金币，请确保您的账户上有足够的金币

2、已购买过的文档，再次下载不重复扣费

3、资料包下载后请先用软件解压，在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN110163344A(43)申请公布日2019.08.23(21)申请号201910344418.7(22)申请日2019.04.26(71)申请人北京迈格威科技有限公司地址100190北京市海淀区科学院南路2号融科资讯中心A座316-318(72)发明人郭义袁野王剑锋俞刚(74)专利代理机构北京华进京联知识产权代理有限公司11606代理人朱五云王程(51)Int.Cl.G06N3/04(2006.01)G06N3/08(2006.01)G06K9/62(2006.01)权利要求书2页说明书14页附图5页(54)发明名称神经网络训练方法、装置、设备和存储介质(57)摘要本发明涉及一种神经网络训练方法、装置、设备和存储介质，终端通过预设的提取方法，获取待训练图片的第一前景信息和第二前景信息，并根据第一前景信息，采用预设的编码器获得教师网络低维特征图，同时根据第二前景信息，采用编码器获得学生网络低维特征图，进而根据教师网络低维特征图和学生网络低维特征图，确定学生网络的监督损失函数，并根据监督损失函数，及预设的自学习损失函数，训练学生网络，自学习损失函数用于根据真实的数据标签训练学生网络。使得训练学生网络的损失函数中同时使用了只作用于前景信息的监督损失函数，和根据真实数据标签得到的自学习损失函数，因此学生网络的损失函数更加准确，提高了学生网络的精度。CN110163344ACN110163344A权利要求书1/2页1.一种神经网络训练方法，其特征在于，所述方法包括：通过预设的提取方法，获取所述待训练图片的第一前景信息和第二前景信息；所述第一前景信息为在教师网络中所述待训练图片对应的前景信息；所述第二前景信息为在学生网络中所述待训练图片对应的前景信息；根据所述第一前景信息，采用预设的编码器获得教师网络低维特征图，并根据所述第二前景信息，采用所述预设的编码器获得学生网络低维特征图；根据所述教师网络低维特征图和所述学生网络低维特征图，确定所述学生网络的监督损失函数；根据所述监督损失函数，及预设的自学习损失函数，训练所述学生网络；所述自学习损失函数用于根据真实的数据标签训练所述学生网络。2.根据权利要求1所述方法，其特征在于，所述根据所述教师网络低维特征图和所述学生网络低维特征图，确定所述学生网络的监督损失函数，包括：根据所述教师网络低维特征图和所述学生网络低维特征图，确定所述监督损失函数的权值；根据所述监督损失函数的权值，确定所述监督损失函数。3.根据权利要求2所述方法，其特征在于，所述根据所述教师网络低维特征图和所述学生网络低维特征图，确定所述监督损失函数的权值，包括：根据公式获取所述监督损失函数的权值fm_weights，其中，所述fm_T表示所述教师网络低维特征图，所述fm_S表示所述学生网络低维特征图。4.根据权利要求1-3任一项所述方法，其特征在于，所述学生网络包括分类分支，则所述训练所述学生网络，包括：将所述待训练图片输入所述教师网络，得到检测对象的第一概率分布；将所述待训练图片输入所述学生网络，得到所述检测对象的第二概率分布分布；将所述第一概率分布作为标签，将所述第二概率分布作为预测值，调整分类损失函数的参数，以训练所述分类分支。5.根据权利要求4所述方法，其特征在于，所述根据所述监督损失函数和所述预设的自学习损失函数，训练所述学生网络还包括：获取所述学生网络的分类损失函数；根据所述监督损失函数、所述预设的自学习损失函数和所述分类损失函数，训练所述学生网络。6.根据权利要求5所述方法，其特征在于，所述获取所述学生网络的分类损失函数，包括：根据所述第一概率分布和所述第二概率分布，确定所述分类损失函数的权值；根据所述分类损失函数的权值，确定所述分类损失函数。7.根据权利要求4-6任一项所述方法，其特征在于，所述学生网络还包括回归分支，所述根据所述监督损失函数、所述预设的自学习损失函数和所述分类损失函数，训练所述学2CN110163344A权利要求书2/2页生网络，包括：获取回归损失函数；根据所述监督损失函数、所述预设的自学习损失函数、所述分类损失函数和所述回归损失函数，训练所述学生网络。8.根据权利要求7所述方法，其特征在于，所述根据所述监督损失函数、所述预设的自学习损失函数、所述分类损失函数和所述回归损失函数，训练所述学生网络，包括：根据预设的权重系数，对所述监督损失函数、所述分类损失函数和所述回归损失函数进行加权处理，获得加权后的监督损失函数、加权后的分类损失函数和加权后的回归损失函数；则根据所述监督损失函数、所述预设的自学习损失函数、所述分类损失函数和所述回归损失函数，训练所述学生网络，包括：根据所述加权后的监督损失函数、所述预设的自学习损失函数

相关资料

神经网络训练方法、装置、设备和存储介质.pdf

本发明涉及一种神经网络训练方法、装置、设备和存储介质，终端通过预设的提取方法，获取待训练图片的第一前景信息和第二前景信息，并根据第一前景信息，采用预设的编码器获得教师网络低维特征图，同时根据第二前景信息，采用编码器获得学生网络低维特征图，进而根据教师网络低维特征图和学生网络低维特征图，确定学生网络的监督损失函数，并根据监督损失函数，及预设的自学习损失函数，训练学生网络，自学习损失函数用于根据真实的数据标签训练学生网络。使得训练学生网络的损失函数中同时使用了只作用于前景信息的监督损失函数，和根据真实数据标签

2024-01-10

1MB

神经网络训练方法、装置、电子设备及存储介质.pdf

本申请实施例提供了神经网络训练方法、装置，该方法包括：将多个训练样本分别输入多个子网络中，其中，每个子网络对应一个训练样本，每个子网络对应的训练样本不同；对目标子网络的目标网络单元输出的第一特征图和对应于第一特征图的第二特征图执行特征融合操作，得到图像融合结果，第二特征图为目标网络单元的关联网络单元输出的特征图或者目标网络单元的关联网络单元的融合特征图；根据图像融合结果得到预测结果；根据预测结果和最后一个目标子网络的监督信息，确定目标损失，以及至少基于目标损失，更新多个子网络。

2024-01-09

467KB

神经网络模型的训练方法、装置、电子设备及存储介质.pdf

本公开提供了神经网络模型的训练方法、装置、电子设备及存储介质,涉及及机器学习领域,尤其涉及深度学习技术领域。具体实现方案为:基于行为一致的多个子张量,构建融合张量并将融合张量存储至预设显存中;构建融合张量与子张量间的映射关系;在需要使用目标子张量的情况下,基于映射关系从融合张量中提取目标子张量以训练神经网络模型;在需要使用融合张量的情况下,从预设显存中提取融合张量以训练神经网络模型。本公开将具有同一行为的子张量进行融合,以融合张量为单位进行处理,可减少计算量,节约计算资源。而且相比通信融合方式,能够减少占

2023-04-19

984KB

神经网络训练方法、装置、可读存储介质和计算机设备.pdf

本申请涉及一种神经网络训练方法、装置、计算机可读存储介质和计算机设备，该方法包括：获取第二神经网络模型，第二神经网络模型的第一网络层包括多个特征领域，各个特征领域存在对应的模型参数，模型参数为与第一网络层连接的第二网络层的输入参数；从第一神经网络模型获取与第一网络层对应的第三网络层，第一神经网络模型已经达到收敛；获取第三网络层中与第一网络层中相同的特征领域，获取相同的特征领域对应的模型参数得到保留模型参数；将保留模型参数作为第二神经网络模型匹配的特征领域的模型参数；输入训练样本至第二神经网络模型进行训练，

2023-11-15

1.4MB

预训练方法、装置、设备和存储介质.pdf

本申请公开了一种预训练方法、装置、设备和存储介质，属于计算机技术领域。所述方法包括：得到字符掩盖处理后的初始文本句；基于字符掩盖处理后的初始文本句和句前的附加字符，得到目标文本句；确定目标文本句对应的mask矩阵，mask矩阵包括多个元素，每个元素用于向待训练的特征提取模型指示在目标文本句中元素对应的两个字符在特征提取过程中的运算关联度，句前的附加字符对应的元素不为0；基于初始文本句、目标文本句和mask矩阵，对待训练的特征提取模型进行训练。采用本申请，不仅仅可以得到目标文本句中每个字符对应的特征向量，还

2023-07-24

691KB