卷积神经网络量化方法、装置、电子设备和存储介质-豆柴文库

卷积神经网络量化方法、装置、电子设备和存储介质.pdf

2023-07-24

10金币

1.2MB

22页

听云****君哇

实名认证

内容提供者

1/10

2/10

3/10

4/10

5/10

6/10

7/10

8/10

9/10

10/10

亲，该文档总共22页，到这已经超出免费预览范围，如果喜欢就直接下载吧～

下载提示文本预览

如果您无法下载资料，请参考说明：

1、部分资料下载需要金币，请确保您的账户上有足够的金币

2、已购买过的文档，再次下载不重复扣费

3、资料包下载后请先用软件解压，在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN114139678A(43)申请公布日2022.03.04(21)申请号202111265219.0(22)申请日2021.10.28(71)申请人中国科学院自动化研究所地址100190北京市海淀区中关村东路95号(72)发明人张峰孟艺薇张翠婷(74)专利代理机构北京路浩知识产权代理有限公司11002代理人李文清(51)Int.Cl.G06N3/04(2006.01)G06N3/08(2006.01)权利要求书3页说明书14页附图4页(54)发明名称卷积神经网络量化方法、装置、电子设备和存储介质(57)摘要本发明提供一种卷积神经网络量化方法、装置、电子设备和存储介质，其中方法包括：按照预设的重要权重优先原则，分别获取预训练卷积神经网络中每一层的第一量化权重范围；其中，所述重要权重优先原则包括基于每一层原始权重的幂指数出现频次确定的原则；对所述第一量化权重范围分别进行权重数量扩充处理，得到所述每一层的第二量化权重范围；基于所述第二量化权重范围，确定所述预训练卷积神经网络的目标量化权重范围。本发明能够实现在相同量化位宽的情况下增加量化范围及减小精度损失的目的，不仅能够减少网络模型的存储空间、减小计算量、减少能源消耗，也能够大大提高量化精度。CN114139678ACN114139678A权利要求书1/3页1.一种卷积神经网络量化方法，其特征在于，包括：按照预设的重要权重优先原则，分别获取预训练卷积神经网络中每一层的第一量化权重范围；其中，所述重要权重优先原则包括基于每一层原始权重的幂指数出现频次确定的原则；对所述第一量化权重范围分别进行权重数量扩充处理，得到所述每一层的第二量化权重范围；基于所述第二量化权重范围，确定所述预训练卷积神经网络的目标量化权重范围。2.根据权利要求1所述的卷积神经网络量化方法，其特征在于，所述按照预设的重要权重优先原则，分别获取预训练卷积神经网络中每一层的第一量化权重范围，包括：分别设定预训练卷积神经网络中每一层的量化权重值域及量化位宽；其中，所述量化权重值域包括多个量化权重，每个所述量化权重的绝对值的幂底数分别相同、幂指数各不相同，且所述量化权重值域中的端点处量化权重的幂指数均未知；按照预设的重要权重优先原则，分别获取所述每一层的原始权重中出现频次最高的第一幂指数以及与所述第一幂指数紧邻的出现频次最高的第二幂指数；基于所述第一幂指数、所述第二幂指数及所述量化位宽，分别计算所述量化权重值域中的端点处量化权重的第一端点幂指数；基于所述第一端点幂指数对应的第一量化权重值域，分别确定所述每一层的第一量化权重范围。3.根据权利要求2所述的卷积神经网络量化方法，其特征在于，所述对所述第一量化权重范围分别进行权重数量扩充处理，得到所述每一层的第二量化权重范围，包括：基于权重去0原则，对所述第一端点幂指数分别进行调整处理，分别得到第二端点幂指数；分别基于所述第二端点幂指数对应的第二量化权重值域，确定所述每一层的第二量化权重范围。4.根据权利要求1所述的卷积神经网络量化方法，其特征在于，所述基于所述第二量化权重范围，确定所述预训练卷积神经网络的目标量化权重范围，包括：将所述每一层的第二量化权重范围进行统一量化处理，得到所述预训练卷积神经网络的目标量化权重范围。5.根据权利要求2所述的卷积神经网络量化方法，其特征在于，所述按照预设的重要权重优先原则，分别确定所述每一层的原始权重中出现频次最高的第一幂指数以及与所述第一幂指数紧邻的出现频次最高的第二幂指数，包括：分别确定所述每一层的原始权重的幂指数Sl，并且按照预设的重要权重优先原则，分别确定所述每一层的原始权重中出现频次最高的第一幂指数maxinuml以及与所述第一幂指数maxinuml紧邻的出现频次最高的第二幂指数maxinum1l，其中：Sl＝floor(log2(4abs(Wl)/3))maxinuml＝Max_num1(Sl)maxinum1l＝Max_neighboor(Sl，maxinuml)；其中，floor(·)表示向下取整，abs(·)表示取绝对值，Wl表示预训练卷积神经网络第l层的原始权重，Sl表示预训练卷积神经网络第l层的原始权重的幂指数，Max_num1(·)表示2CN114139678A权利要求书2/3页取出出现频次最高的值，Max_neighboor(Sl，maxinuml)表示在Sl里取出与maxinuml的值相邻且出现频次最高的值，maxinuml表示第l层的原始权重Wl中出现频次最高的第一幂指数，maxinum1l表示与maxinuml紧邻的出现频次最高的第二幂指数，1≤l≤L，L表示预训练卷积神经网络中可学习层的总层数。6.根据权利要求5所述的卷积神经网络量化方

相关资料

卷积神经网络量化方法、装置、电子设备和存储介质.pdf

本发明提供一种卷积神经网络量化方法、装置、电子设备和存储介质，其中方法包括：按照预设的重要权重优先原则，分别获取预训练卷积神经网络中每一层的第一量化权重范围；其中，所述重要权重优先原则包括基于每一层原始权重的幂指数出现频次确定的原则；对所述第一量化权重范围分别进行权重数量扩充处理，得到所述每一层的第二量化权重范围；基于所述第二量化权重范围，确定所述预训练卷积神经网络的目标量化权重范围。本发明能够实现在相同量化位宽的情况下增加量化范围及减小精度损失的目的，不仅能够减少网络模型的存储空间、减小计算量、减少能源

2023-07-24

1.2MB

卷积神经网络模型剪枝方法和装置、电子设备、存储介质.pdf

本公开实施例提供卷积神经网络模型剪枝方法和装置、电子设备、存储介质，涉及人工智能技术领域。该卷积神经网络模型剪枝方法，包括：获取待剪枝模型的损失函数，对损失函数进行泰勒展开，得到第一参数重要性指标值和第二参数重要性指标值；根据第一参数重要性指标值和第二参数重要性指标值计算每个滤波器对应的剪枝重要性指标；根据预设剪枝率和每个滤波器对应的剪枝重要性指标，对待剪枝模型进行剪枝得到剪枝模型。本实施例考虑滤波器之间的关系以及模型中每个卷积层内部滤波器的冗余信息，量化滤波器的重要性，提高卷积神经网络模型剪枝的准确率，

2023-11-01

709KB

神经网络的量化方法、装置、存储介质及电子设备.pdf

本公开涉及一种神经网络的量化方法、装置、存储介质及电子设备，该量化方法包括：接收神经网络中的前一神经网络层输出的与第一量化位宽对应的第一取值范围区间的输入数据；将输入数据映射到至少包括与第二量化位宽对应的第二取值范围区间，得到量化输入数据；根据量化输入数据对应的量化位宽进行计算，得到量化输出数据；将量化输出数据反映射到与第一量化位宽对应的第一取值范围区间，获得输出数据。本公开实现了量化的后的神经网络在不降低硬件间数据传输效率的同时提升推理精度的目的。

2023-07-24

554KB

模型量化方法、装置、电子设备和存储介质.pdf

本申请公开了模型量化方法、装置、电子设备和存储介质，涉及人工智能技术领域，具体为深度学习、图像处理、计算机视觉技术领域，可应用于智慧城市等场景。具体实现方案为：获取客户端发送的模型量化请求，其中，模型量化请求中包括待处理模型及待处理模型对应的量化配置信息；根据量化配置信息，确定待处理模型对应的目标芯片类型；根据量化配置信息和目标芯片类型，对待处理模型进行量化，以获取目标芯片类型对应的量化后的模型。该方法可以针对不同类型的芯片进行模型量化，从而实现不同芯片类型统一的模型量化流程。

2023-07-22

838KB

神经网络模型量化方法及装置、存储介质及电子设备.pdf

本公开涉及模型量化技术领域,具体涉及一种神经网络模型量化方法及装置、计算机可读存储介质及电子设备,方法包括:获取浮点型预训练神经网络模型;确定预设量化精度,并根据预设量化精度对预训练神经网络模型进行量化得到中间神经网络模型;获取训练数据,并利用训练数据对中间神经网络模型进行预设量化精度的量化感知训练得到目标神经网络模型。本公开实施例的技术方案提升模型量化方法的精度,克服了量化过程中模型精度损失较大的问题。

2023-06-21

749KB