预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共16页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113762456A(43)申请公布日2021.12.07(21)申请号202011356338.2(22)申请日2020.11.26(71)申请人北京沃东天骏信息技术有限公司地址100176北京市北京经济技术开发区科创十一街18号院2号楼4层A402室申请人北京京东世纪贸易有限公司(72)发明人陈伯梁(74)专利代理机构中原信达知识产权代理有限责任公司11219代理人张一军张效荣(51)Int.Cl.G06N3/04(2006.01)权利要求书2页说明书9页附图4页(54)发明名称一种模型参数调节方法和系统(57)摘要本发明公开了一种模型参数调节方法和系统,涉及计算机技术领域。该方法的一具体实施方式包括:多个从节点获取待调参模型的多个参数,其中,每一个从节点设置有第一神经网络模型、待调参模型以及待调参模型所需训练样本集;从节点基于第一神经网络模型、待调参模型的多个参数、待调参模型和待调参模型所需训练样本集,迭代调节待调参模型的多个参数;主节点根据多个从节点的迭代调节的结果,计算待调参模型的多个目标参数。该实施方式缩短待调参模型的调参周期。CN113762456ACN113762456A权利要求书1/2页1.一种模型参数调节方法,其特征在于,包括:多个从节点获取待调参模型的多个参数,其中,每一个所述从节点设置有第一神经网络模型、所述待调参模型以及所述待调参模型所需训练样本集;所述从节点基于所述第一神经网络模型、所述待调参模型的多个参数、所述待调参模型和所述待调参模型所需训练样本集,迭代调节所述待调参模型的多个参数;主节点根据多个所述从节点的迭代调节的结果,计算所述待调参模型的多个目标参数。2.根据权利要求1所述模型参数调节方法,其特征在于,迭代调节所述待调参模型的多个参数,包括:针对每一次迭代过程,执行:将所述待调参模型的多个当前参数输入所述第一神经网络模型,得到每一个所述当前参数的参数变量;根据所述当前参数的参数变量,调节所述当前参数。3.根据权利要求2所述模型参数调节方法,其特征在于,进一步包括:针对每一次迭代调节,执行:利用所述当前参数、所述待调参模型以及所述待调参模型所需训练样本集,计算所述待调参模型的评估指标;根据所述评估指标以及所述当前参数,计算所述第一神经网络模型的损失以及网络梯度;利用所述第一神经网络模型的损失以及网络梯度,调整所述第一神经网络模型。4.根据权利要求3所述模型参数调节方法,其特征在于,进一步包括:所述从节点将多次迭代调节得到的多个网络梯度发送给主节点;所述主节点利用设置的第二神经网络模型以及多个所述从节点的多个网络梯度,更新所述网络梯度,并将更新后的结果发送给多个所述从节点;所述从节点根据更新后的结果,调整所述第一神经网络模型,以利用调整后的第一神经网络模型,继续执行迭代调节所述待调参模型的多个参数的步骤。5.根据权利要求1至4任一所述模型参数调节方法,其特征在于,进一步包括:判断迭代调节的步骤是否满足迭代停止条件,如果是,则执行计算所述待调参模型的多个目标参数。6.根据权利要求5所述模型参数调节方法,其特征在于,迭代停止条件,包括:迭代调节所述待调参模型的多个参数的步骤的执行次数达到预设的迭代阈值;或者,得到的每一个所述当前参数的参数变量在设定变化范围内。7.根据权利要求3所述模型参数调节方法,其特征在于,所述评估指标包括:待调参模型的输出结果与真实值之间的差值、精确度、准确率以及召回率中的任意一种。8.一种模型参数调节系统,其特征在于,包括:多个从节点以及主节点,其中,每一个所述从节点,用于获取待调参模型的多个参数,其中,每一个所述从节点设置有第一神经网络模型、所述待调参模型以及所述待调参模型所需训练样本集;基于所述第一2CN113762456A权利要求书2/2页神经网络模型、所述待调参模型的多个参数、所述待调参模型和所述待调参模型所需训练样本集,迭代调节所述待调参模型的多个参数;所述主节点,用于根据多个所述从节点的迭代调节的结果,计算所述待调参模型的多个目标参数。9.根据权利要求8所述模型参数调节系统,其特征在于,所述从节点,用于针对每一次迭代过程,执行:将所述待调参模型的多个当前参数输入所述第一神经网络模型,得到每一个所述当前参数的参数变量;根据所述当前参数的参数变量,调节所述当前参数。10.一种电子设备,其特征在于,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-7中任一所述的方法。11.一种计算机可读介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1-7中任一所述的方法。3CN11