预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共22页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN114154615A(43)申请公布日2022.03.08(21)申请号202110230981.9(22)申请日2021.03.02(30)优先权数据10-2020-01147032020.09.08KR(71)申请人三星电子株式会社地址韩国京畿道水原市(72)发明人崔赛纶(74)专利代理机构北京铭硕知识产权代理有限公司11286代理人黄晓燕张川绪(51)Int.Cl.G06N3/04(2006.01)G06N3/063(2006.01)权利要求书3页说明书12页附图6页(54)发明名称基于硬件性能的神经架构搜索方法和设备(57)摘要提供了基于硬件性能的神经架构搜索方法和设备。所述方法包括:获取包括在预训练的神经网络中的神经网络块所对应的硬件性能;从神经网络块选择用于硬件性能改善的至少一个目标块;基于任意输入数据和目标块的基于输入数据生成的输出数据,训练与目标块对应的候选块的权重和架构参数;和通过基于训练的架构参数使用候选块之一替换预训练的神经网络中的目标块,来更新预训练的神经网络。CN114154615ACN114154615A权利要求书1/3页1.一种处理器实现的基于硬件性能的神经架构搜索方法,包括:获取包括在预训练的神经网络中的神经网络块所对应的硬件性能;从神经网络块选择用于硬件性能改善的至少一个目标块;基于任意输入数据和目标块的基于输入数据生成的输出数据,训练与目标块对应的候选块的权重和架构参数;和通过基于训练的架构参数使用候选块之一替换预训练的神经网络中的目标块,更新预训练的神经网络。2.根据权利要求1所述的神经架构搜索方法,其中,针对相应候选块中的每个,训练的步骤包括:基于相应候选块的输出数据与目标块的输出数据之间的匹配程度以及相应候选块所对应的硬件性能来生成损失函数,其中,相应候选块的输出数据和目标块的输出数据基于同一输入数据被生成;和基于损失函数训练相应候选块的权重和架构参数。3.根据权利要求1所述的神经架构搜索方法,其中,针对相应候选块中的每个,训练的步骤包括:基于相应候选块的架构参数来确定相应候选块是否是待训练的目标;和响应于相应候选块被确定为待训练的目标,训练相应候选块。4.根据权利要求3所述的神经架构搜索方法,其中,确定的步骤包括:响应于相应候选块的架构参数大于或等于预定阈值,确定相应候选块是待训练的目标。5.根据权利要求1所述的神经架构搜索方法,其中,获取神经网络块所对应的硬件性能的步骤包括:基于执行神经网络块的操作的实际硬件的性能的测量值来确定神经网络块所对应的硬件性能。6.根据权利要求1所述的神经架构搜索方法,其中,获取神经网络块所对应的硬件性能的步骤包括:基于学习了执行神经网络块的操作的硬件的性能的预测模型来估计神经网络块所对应的硬件性能。7.根据权利要求1所述的神经架构搜索方法,其中,获取神经网络块所对应的硬件性能的步骤包括:基于执行神经网络块的操作的硬件的性能的模拟来估计神经网络块所对应的硬件性能。8.根据权利要求1至权利要求7中任意一项所述的神经架构搜索方法,其中,选择目标块的步骤包括以下中的任意一者或两者:按照神经网络块所对应的硬件性能的升序选择神经网络块中的至少一个作为目标块;和将神经网络块所对应的硬件性能与阈值进行比较,并且选择神经网络块中的对应于低于阈值的硬件性能的至少一个作为目标块。9.根据权利要求1至权利要求7中任意一项所述的神经架构搜索方法,其中,训练的步骤包括:2CN114154615A权利要求书2/3页生成输入数据并通过将输入数据输入到目标块来生成输出数据,作为训练数据;基于训练数据来训练候选块中的至少一个;和响应于基于训练数据执行的训练的完成而移除训练数据。10.根据权利要求1至权利要求7中任意一项所述的神经架构搜索方法,其中,训练的步骤包括:获取具有与目标块的输入维度和输出维度相同的输入维度和输出维度的块,作为候选块。11.根据权利要求1至权利要求7中任意一项所述的神经架构搜索方法,其中,替换目标块的步骤包括:从候选块选择候选块中的具有最大架构参数的候选块;和使用选择的候选块替换目标块。12.根据权利要求1至权利要求7中任意一项所述的神经架构搜索方法,其中,选择目标块的步骤还包括:基于硬件限制条件从神经网络块选择目标块。13.根据权利要求12所述的神经架构搜索方法,其中,针对相应候选块中的每个,训练的步骤包括:基于相应候选块的输出数据与目标块的输出数据之间的匹配程度、相应候选块所对应的硬件性能以及硬件限制条件来生成损失函数,其中,相应候选块的输出数据与目标块的输出数据基于同一输入数据被生成;和基于损失函数训练相应候选块的权重和架构参数。14.根据权利要求12所述的神经架构搜索方法,其中,硬