卷积神经网络量化方法、装置、电子设备和存储介质.pdf
听云****君哇
亲,该文档总共22页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
相关资料
卷积神经网络量化方法、装置、电子设备和存储介质.pdf
本发明提供一种卷积神经网络量化方法、装置、电子设备和存储介质,其中方法包括:按照预设的重要权重优先原则,分别获取预训练卷积神经网络中每一层的第一量化权重范围;其中,所述重要权重优先原则包括基于每一层原始权重的幂指数出现频次确定的原则;对所述第一量化权重范围分别进行权重数量扩充处理,得到所述每一层的第二量化权重范围;基于所述第二量化权重范围,确定所述预训练卷积神经网络的目标量化权重范围。本发明能够实现在相同量化位宽的情况下增加量化范围及减小精度损失的目的,不仅能够减少网络模型的存储空间、减小计算量、减少能源
卷积神经网络模型剪枝方法和装置、电子设备、存储介质.pdf
本公开实施例提供卷积神经网络模型剪枝方法和装置、电子设备、存储介质,涉及人工智能技术领域。该卷积神经网络模型剪枝方法,包括:获取待剪枝模型的损失函数,对损失函数进行泰勒展开,得到第一参数重要性指标值和第二参数重要性指标值;根据第一参数重要性指标值和第二参数重要性指标值计算每个滤波器对应的剪枝重要性指标;根据预设剪枝率和每个滤波器对应的剪枝重要性指标,对待剪枝模型进行剪枝得到剪枝模型。本实施例考虑滤波器之间的关系以及模型中每个卷积层内部滤波器的冗余信息,量化滤波器的重要性,提高卷积神经网络模型剪枝的准确率,
神经网络的量化方法、装置、存储介质及电子设备.pdf
本公开涉及一种神经网络的量化方法、装置、存储介质及电子设备,该量化方法包括:接收神经网络中的前一神经网络层输出的与第一量化位宽对应的第一取值范围区间的输入数据;将输入数据映射到至少包括与第二量化位宽对应的第二取值范围区间,得到量化输入数据;根据量化输入数据对应的量化位宽进行计算,得到量化输出数据;将量化输出数据反映射到与第一量化位宽对应的第一取值范围区间,获得输出数据。本公开实现了量化的后的神经网络在不降低硬件间数据传输效率的同时提升推理精度的目的。
模型量化方法、装置、电子设备和存储介质.pdf
本申请公开了模型量化方法、装置、电子设备和存储介质,涉及人工智能技术领域,具体为深度学习、图像处理、计算机视觉技术领域,可应用于智慧城市等场景。具体实现方案为:获取客户端发送的模型量化请求,其中,模型量化请求中包括待处理模型及待处理模型对应的量化配置信息;根据量化配置信息,确定待处理模型对应的目标芯片类型;根据量化配置信息和目标芯片类型,对待处理模型进行量化,以获取目标芯片类型对应的量化后的模型。该方法可以针对不同类型的芯片进行模型量化,从而实现不同芯片类型统一的模型量化流程。
神经网络模型量化方法及装置、存储介质及电子设备.pdf
本公开涉及模型量化技术领域,具体涉及一种神经网络模型量化方法及装置、计算机可读存储介质及电子设备,方法包括:获取浮点型预训练神经网络模型;确定预设量化精度,并根据预设量化精度对预训练神经网络模型进行量化得到中间神经网络模型;获取训练数据,并利用训练数据对中间神经网络模型进行预设量化精度的量化感知训练得到目标神经网络模型。本公开实施例的技术方案提升模型量化方法的精度,克服了量化过程中模型精度损失较大的问题。