神经网络模型部署方法、装置、电子设备及存储介质.pdf
猫巷****傲柏
亲,该文档总共30页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
相关资料
神经网络模型部署方法、装置、电子设备及存储介质.pdf
本公开涉及一种神经网络模型部署方法、装置、电子设备及存储介质,所述方法包括获取待部署到硬件设备上的原始神经网络模型所对应的原始计算图;将原始计算图转换为基于目标算子集构成的中间计算图,目标算子集为硬件设备支持的算子集;根据硬件设备对应的硬件约束条件,将中间计算图转换为适配硬件设备的目标计算图,硬件约束条件是基于硬件设备对应的数据精度、硬件资源以及目标算子集中的至少一种所确定的;基于目标计算图,确定硬件可执行文件,硬件可执行文件用于部署到硬件设备上。本公开实施例可实现将各种原始神经网络模型高效统一地转换成能
模型部署处理方法、装置、电子设备及存储介质.pdf
本申请涉及模型部署处理方法、装置、电子设备及存储介质,属于服务器部署模型技术领域。本申请包括:获取表征多模型数据处理的有向图以及服务器所能提供的资源,利用有向图中模型计算所需资源和模型间通信开销,对有向图进行分割处理,得到目标分割结果,对于目标分割结果中各子图所对应的模型集合,在模型集合计算所需资源得到服务器提供的基础上,模型集合间的通信开销整体最小;基于目标分割结果,确定多模型部署所需服务器并为服务器分配模型集合。通过本申请,有助于实现将多模型拆分部署于不同服务器下时服务器的整体性能达到最优。
神经网络模型量化方法及装置、存储介质及电子设备.pdf
本公开涉及模型量化技术领域,具体涉及一种神经网络模型量化方法及装置、计算机可读存储介质及电子设备,方法包括:获取浮点型预训练神经网络模型;确定预设量化精度,并根据预设量化精度对预训练神经网络模型进行量化得到中间神经网络模型;获取训练数据,并利用训练数据对中间神经网络模型进行预设量化精度的量化感知训练得到目标神经网络模型。本公开实施例的技术方案提升模型量化方法的精度,克服了量化过程中模型精度损失较大的问题。
一种模型部署方法、装置、电子设备及存储介质.pdf
本发明提供一种模型部署方法、装置、电子设备及储存介质,其特征在于,所述方法包括:对训练后的初始模型进行量化,得到量化模型;获取量化模型的各模块的onnx模型及量化校准文件;修正各模块的onnx模型及量化校准文件;合并各模块的onnx模型及量化校准文件,得到第一onnx模型和量化校准文件集;将量化校准文件集转码为可读取文件;基于第一onnx模型和可读取文件,由平台生成模型;对平台生成的模型进行部署。本发明中获取量化后模型的onnx模型,提高tensorRT对算子的融合,提高运行效率,并转化为特定平台的模型,
神经网络模型的训练方法、装置、电子设备及存储介质.pdf
本公开提供了神经网络模型的训练方法、装置、电子设备及存储介质,涉及及机器学习领域,尤其涉及深度学习技术领域。具体实现方案为:基于行为一致的多个子张量,构建融合张量并将融合张量存储至预设显存中;构建融合张量与子张量间的映射关系;在需要使用目标子张量的情况下,基于映射关系从融合张量中提取目标子张量以训练神经网络模型;在需要使用融合张量的情况下,从预设显存中提取融合张量以训练神经网络模型。本公开将具有同一行为的子张量进行融合,以融合张量为单位进行处理,可减少计算量,节约计算资源。而且相比通信融合方式,能够减少占