神经网络参数矩阵的稀疏化方法和装置-豆柴文库

神经网络参数矩阵的稀疏化方法和装置.pdf

2023-08-28

10金币

538KB

13页

慧娇****文章

实名认证

内容提供者

1/10

2/10

3/10

4/10

5/10

6/10

7/10

8/10

9/10

10/10

亲，该文档总共13页，到这已经超出免费预览范围，如果喜欢就直接下载吧～

下载提示文本预览

如果您无法下载资料，请参考说明：

1、部分资料下载需要金币，请确保您的账户上有足够的金币

2、已购买过的文档，再次下载不重复扣费

3、资料包下载后请先用软件解压，在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN110516806A(43)申请公布日2019.11.29(21)申请号201910814977.X(22)申请日2019.08.30(71)申请人苏州思必驰信息科技有限公司地址215123江苏省苏州市苏州工业园区新平街388号腾飞创新园14栋(72)发明人蒋泳森(74)专利代理机构北京商专永信知识产权代理事务所(普通合伙)11400代理人黄谦邓婷婷(51)Int.Cl.G06N3/08(2006.01)G06F17/16(2006.01)权利要求书2页说明书7页附图3页(54)发明名称神经网络参数矩阵的稀疏化方法和装置(57)摘要本发明公开神经网络参数矩阵的稀疏化方法和装置，其中，一种神经网络参数矩阵的稀疏化方法，包括：在对神经网络参数进行每一轮迭代训练之前，选出所述神经网络参数矩阵中最冗余的多个参数；将所述最冗余的多个参数置0；对置0后的参数进行标记并在之后的迭代训练过程中不再更新标记后的参数。本申请的方法和装置提供的方案通过增量式稀疏化算法，网络最终的稀疏化能够达到80％以上，大大的降低了参数所需的存储空间，提升计算速度，并且因为是增量式的稀疏化算法，每一轮虽然置0了部分权值，但是非0部分还是会参与训练，所以识别的性能不会降低。CN110516806ACN110516806A权利要求书1/2页1.一种神经网络参数矩阵的稀疏化方法，包括：在对神经网络参数进行每一轮迭代训练之前，选出所述神经网络参数矩阵中最冗余的多个参数；将所述最冗余的多个参数置0；对置0后的参数进行标记并在之后的迭代训练过程中不再更新标记后的参数。2.根据权利要求1所述的方法，其中，所述在对神经网络参数进行每一轮迭代训练之前，选出所述神经网络参数矩阵中最冗余的多个参数包括：在对神经网络参数进行每一轮迭代训练之前，将所述神经网络参数矩阵中非0的参数按照绝对值大小的顺序排列；基于预设比例选出绝对值最小的多个参数为最冗余的多个参数。3.根据权利要求2所述的方法，其中，所述方法还包括：在对神经网络参数进行下一轮迭代训练之前，从未被标记的参数中选出所述神经网络参数矩阵中最冗余的多个参数；将所述最冗余的多个参数置0；对置0后的参数进行标记并在之后的迭代训练过程中不再更新标记后的参数。4.根据权利要求1所述的方法，其中，所述在对神经网络参数进行每一轮迭代训练之前，选出所述神经网络参数矩阵中最冗余的多个参数包括：在对神经网络参数进行每一轮迭代训练之前，将所述神经网络参数矩阵中的参数的绝对值和预设阈值进行比较；如果多个参数的绝对值小于所述预设阈值，将所述多个参数确定为最冗余的多个参数。5.根据权利要求4所述的方法，其中，所述方法还包括：如果某些参数的绝对值大于等于所述预设阈值，将所述某些参数确定为非冗余参数。6.根据权利要求1-5中任一项所述的方法，其中，所述对所选出置0的参数进行标记包括：记录所述置0后的参数在所述神经网络参数矩阵中的索引位置。7.一种神经网络参数矩阵的稀疏化装置，包括：冗余参数选择模块，配置为在对神经网络参数进行每一轮迭代训练之前，选出所述神经网络参数矩阵中最冗余的多个参数；置0模块，配置为将所述最冗余的多个参数置0；标记模块，配置为对置0后的参数进行标记并在之后的迭代训练过程中不再更新标记后的参数。8.根据权利要求7所述的装置，其中，所述冗余参数选择模块进一步配置为：在对神经网络参数进行每一轮迭代训练之前，将所述神经网络参数矩阵中非0的参数按照绝对值大小的顺序排列；基于预设比例选出绝对值最小的多个参数为最冗余的多个参数。9.一种电子设备，其包括：至少一个处理器，以及与所述至少一个处理器通信连接的存储器，其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行权利要求1至6任一项所述方法的步2CN110516806A权利要求书2/2页骤。10.一种存储介质，其上存储有计算机程序，其特征在于，所述程序被处理器执行时实现权利要求1至6任一项所述方法的步骤。3CN110516806A说明书1/7页神经网络参数矩阵的稀疏化方法和装置技术领域[0001]本发明属于神经网络技术领域，尤其涉及神经网络参数矩阵的稀疏化方法和装置。背景技术[0002]相关技术中，svd(SingularValueDecomposition，奇异值分解)分解算法，nodeprune点裁剪算法，传统的稀疏矩阵算法是目前比较常见的几种技术。其中，svd分解算法：把一个m*n的矩阵做svd分解成m*r+r*n(r<<n)；Nodeprune：根据矩阵的某一行或者某一列的总的权重做为代价从而裁剪掉某行某列；传统的稀疏矩阵算法：训练过程中做L1范数约束；对训练

相关资料

神经网络参数矩阵的稀疏化方法和装置.pdf

本发明公开神经网络参数矩阵的稀疏化方法和装置，其中，一种神经网络参数矩阵的稀疏化方法，包括：在对神经网络参数进行每一轮迭代训练之前，选出所述神经网络参数矩阵中最冗余的多个参数；将所述最冗余的多个参数置0；对置0后的参数进行标记并在之后的迭代训练过程中不再更新标记后的参数。本申请的方法和装置提供的方案通过增量式稀疏化算法，网络最终的稀疏化能够达到80％以上，大大的降低了参数所需的存储空间，提升计算速度，并且因为是增量式的稀疏化算法，每一轮虽然置0了部分权值，但是非0部分还是会参与训练，所以识别的性能不会降低

2023-08-28

538KB

基于神经网络双重稀疏性矩阵乘法运算电路、方法和装置.pdf

本申请公开一种基于神经网络双重稀疏性矩阵乘法运算电路、方法和装置,包括主控制器、矩阵计算阵列、数据输入输出缓存单元、存储器;矩阵计算阵列根据程序指令接收输入矩阵或向量数据,执行对应的计算;所述矩阵计算阵列包含若干个PE计算单元,用于执行具体乘累加、池化、激活运算;所述矩阵计算阵列根据预设程序或配置指令,将矩阵数据分解为向量段,发送至对应的所述PE计算单元执行。本申请能够降低内存空间消耗、提高访存读写效率及缓存命中率,从而提高AI处理器的计算效率。

2023-05-23

540KB

神经网络处理器的稀疏化数据处理方法和装置.pdf

本公开提出一种神经网络处理器的稀疏化数据处理方法和装置，神经网络处理器包括：基础计算单元，该方法包括：获取多组权重子向量，其中，权重子向量是基于基础计算单元所支持信息单位对待计算权重向量稀疏化处理得到；确定与待计算权重向量对应的待计算特征向量；控制基础计算单元对每组权重子向量和待计算特征向量进行向量内积运算，以得到向量运算结果；以及对部分组向量运算结果进行移位运算，并将移位运算所得向量运算结果与剩余组向量运算结果进行相加计算，以及将相加计算所得结果作为稀疏化数据处理结果，其中，部分组向量运算结果和剩余组向

2023-06-07

974KB

卷积神经网络的稀疏化方法的开题报告.docx

卷积神经网络的稀疏化方法的开题报告一、研究背景目前，卷积神经网络(ConvolutionalNeuralNetwork,CNN)在各种计算机视觉任务中都表现出了强大的性能，例如图像分类、目标检测和语义分割等。然而，在建立复杂的CNN模型时，不可避免地会面临诸多问题，例如参数量大、过拟合等。这些问题导致的负面影响非常明显，影响模型的性能和泛化能力。因此，近年来，卷积神经网络的稀疏化方法成为研究热点之一。稀疏化技术通过减少神经网络中的参数数量，从而使得模型更小巧、更快速，同时也能提高模型的泛化能力和抗干扰能力

2024-10-09

11KB

批量修改参数化模型的方法和装置.pdf

本发明公开了一种批量修改参数化模型的方法和装置，包括：模型预选模块，用于预选一批参数化模型；类型编辑模块，用于根据参数化模型特征，指定编辑类型，其中，编辑类型包括变量值、变量类型、子模型样式、模型自身属性值；模型确认模块，依据编辑类型从预选的一批参数化模型确定需要被执行编辑操作的多个参数化模型；目标输入模块，用于输入编辑类型的执行目标；执行模块，用于依据编辑类型的执行目标对确定的多个参数化模型执行批量编辑操作，以修改参数化模型的编辑类型。该方法和装置能够高效准确地实现对参数化模型的批量修改。

2023-07-25

470KB