预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共19页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN114330713A(43)申请公布日2022.04.12(21)申请号202210028927.0(22)申请日2022.01.11(71)申请人平安科技(深圳)有限公司地址518000广东省深圳市福田区福田街道福安社区益田路5033号平安金融中心23楼(72)发明人王晓锐(74)专利代理机构广州嘉权专利商标事务所有限公司44205代理人尹长斌(51)Int.Cl.G06N3/08(2006.01)G06N3/04(2006.01)权利要求书2页说明书13页附图3页(54)发明名称卷积神经网络模型剪枝方法和装置、电子设备、存储介质(57)摘要本公开实施例提供卷积神经网络模型剪枝方法和装置、电子设备、存储介质,涉及人工智能技术领域。该卷积神经网络模型剪枝方法,包括:获取待剪枝模型的损失函数,对损失函数进行泰勒展开,得到第一参数重要性指标值和第二参数重要性指标值;根据第一参数重要性指标值和第二参数重要性指标值计算每个滤波器对应的剪枝重要性指标;根据预设剪枝率和每个滤波器对应的剪枝重要性指标,对待剪枝模型进行剪枝得到剪枝模型。本实施例考虑滤波器之间的关系以及模型中每个卷积层内部滤波器的冗余信息,量化滤波器的重要性,提高卷积神经网络模型剪枝的准确率,提升模型压缩精度和运算速度。CN114330713ACN114330713A权利要求书1/2页1.一种卷积神经网络模型剪枝方法,其特征在于,包括:获取待剪枝模型的损失函数,所述待剪枝模型为卷积神经网络模型;在每个滤波器对应的模型权重参数集的邻域内,对所述损失函数进行泰勒展开,得到第一参数重要性指标值;在每个所述滤波器对应的批规范化层中缩放因子的邻域内,对所述损失函数进行泰勒展开,得到第二参数重要性指标值;根据所述第一参数重要性指标值和所述第二参数重要性指标值计算每个所述滤波器对应的剪枝重要性指标;根据预设剪枝率和每个所述滤波器对应的所述剪枝重要性指标,对所述待剪枝模型进行剪枝得到剪枝模型。2.根据权利要求1所述的卷积神经网络模型剪枝方法,其特征在于,所述待剪枝模型的损失函数为:交叉熵损失函数、L1范数损失函数和L2范数损失函数中一种。3.根据权利要求2所述的卷积神经网络模型剪枝方法,其特征在于,所述在每个所述滤波器对应的模型权重参数集的邻域内,对所述损失函数进行泰勒展开,得到第一参数重要性指标值,包括:在每个所述滤波器对应的模型权重参数集的邻域内对所述损失函数进行一阶泰勒展开,得到所述第一参数重要性指标值;所述第一参数重要性指标值表示为:其中,Im1表示第m个滤波器的第一参数重要性指标值,E(D,W)表示所述待剪枝模型的损失函数,wm表示第m个滤波器的所述权重参数。4.根据权利要求2所述的卷积神经网络模型剪枝方法,其特征在于,所述在每个所述滤波器对应的批规范化层中缩放因子的邻域内,对所述损失函数进行泰勒展开,得到第二参数重要性指标值,包括:在每个所述滤波器对应的批规范化层中缩放因子的邻域内对所述损失函数进行一阶泰勒展开,得到所述第二参数重要性指标值;所述第二参数重要性指标值表示为:其中,Im2表示第m个滤波器的第二参数重要性指标值,E(D,W)表示所述待剪枝模型的损失函数,γm表示第m个滤波器在批规范化层中对应的缩放因子。5.根据权利要求1所述的卷积神经网络模型剪枝方法,其特征在于,所述根据所述第一参数重要性指标值和所述第二参数重要性指标值计算每个所述滤波器对应的剪枝重要性指标,包括:获取所述第一参数重要性指标值和所述第二参数重要性指标值的乘积;将所述乘积作为每个所述滤波器对应的所述剪枝重要性指标;所述剪枝重要性指标表示为:2CN114330713A权利要求书2/2页Pm=Im1Im2其中,Pm表示第m个滤波器的剪枝重要性指标,Im1表示第m个滤波器的第一参数重要性指标值,Im2表示第m个滤波器的第二参数重要性指标值。6.根据权利要求1至5任一项所述的卷积神经网络模型剪枝方法,其特征在于,所述根据预设剪枝率和每个所述滤波器对应的所述剪枝重要性指标,对所述待剪枝模型进行剪枝得到剪枝模型,包括:根据每个所述滤波器对应的剪枝重要性指标进行排序,得到剪枝重要性排序结果;根据所述预设剪枝率和所述剪枝重要性排序结果,去掉对应滤波器,得到所述剪枝模型。7.根据权利要求6所述的卷积神经网络模型剪枝方法,其特征在于,得到所述剪枝模型后,还包括:对所述剪枝模型进行微调,包括:根据预设选取规则,选取所述剪枝模型的部分滤波器;对所述剪枝模型中选取剩下的所述滤波器和对应的全连接层进行模型训练,得到所述剪枝模型。8.一种卷积神经网络模型剪枝装置,其特征在于,包括:损失函数获取模块,用于获取待剪枝模型的损失函数,所述待剪枝模型为卷积神经网络