一种通用神经网络张量处理器.pdf
努力****晓骞
亲,该文档总共11页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
相关资料
一种通用神经网络张量处理器.pdf
本发明公开了一种通用神经网络张量处理器,由指令流内核、数据流内核、系统总线、指令流外设总线和数据流外设总线五个模块组成,通过内置的具有有限计算类型的、采用数据流计算技术实现的数据流内核,提供高算力、低能耗且高性能的数据计算,同时通过内置一个具有图灵完备指令集、可无限扩展计算类型、采用指令集计算技术实现的指令流内核,提供高灵活性的数据操作(搬运、组合等),数据流内核主要负责高算力计算任务,指令流内核主要负责非计算类任务,数据流内核与指令流内核互为补充,从而实现具备算子可扩展能力、高算力、低能耗、高性能且灵活
一种面向通用神经网络张量处理器的统一计算方法.pdf
本发明公开了一种面向通用神经网络张量处理器的统一计算方法,在统一的环境与方法下同时实现指令计算与算子计算,把神经网络算法与应用的内容全部以算子的形式进行表达,其中,所述神经网络算法相关的计算以神经网络算子形式来表达,神经网络应用相关的计算以自定义指令算子的形式来表达。本发明的统一计算方法,可以在通用神经网络张量处理器中同时执行算子与指令,使得系统既具备数据处理器的高性能、低能耗特性,又具备指令处理器的通用灵活性。
用于神经网络张量处理器的稀疏数据压缩装置及方法.pdf
本发明涉及神经网络张量处理器领域,特别是一种用于神经网络张量处理器的稀疏数据压缩装置及方法。所述方法包括:读取压缩操作的配置数据并配置稀疏数据压缩装置的各模块;根据配置信息,读取稀疏数据;判断并标记稀疏特征点;删除稀疏特征点数据,生成稀疏压缩数据和稀疏映射表;写出稀疏压缩数据;写出稀疏映射表。本方法通过遍历稀疏数据、判断和标记稀疏特征点、删除稀疏特征点并构建稀疏映射表的方式,可以高效的实现稀疏数据的0数据删除和数据重排操作,从而高效实现稀疏数据的压缩,具有压缩计算复杂性低、效率高的优点。
一种基于卷积神经网络的稀疏张量存储格式自动选择方法.pdf
本发明公开了一种基于卷积神经网络的稀疏张量存储格式自动选择方法,包括:1)通过展平和映射两种转换方法分别将多维张量降低为二维矩阵;2)通过密度表示或直方图表示将矩阵缩放为固定大小;3)将固定大小的矩阵作为卷积神经网络CNN的输入,其中CNN的结构为面向稀疏张量存储格式自动选择而设计定制;4)用监督学习的方法训练CNN并得到训练后的网络模型;5)将新的稀疏张量作为网络模型的输入,前向传播后得到该张量的最佳存储格式。本发明利用CNN在分类问题下的优势,并结合前馈神经网络FFNN以适配最佳稀疏张量存储格式的预测
深度学习处理器张量编译优化研究的任务书.docx
深度学习处理器张量编译优化研究的任务书任务书:一、任务目的随着深度学习技术的快速发展,深度学习应用越来越广泛,其在计算机视觉、自然语言处理和语音识别等领域中发挥了重要作用。在深度学习模型中,张量操作是非常常见的,而这些张量操作通常是非常耗时的。因此,对于深度学习处理器(DPU)的张量编译优化是非常必要的。本次任务的目的是研究深度学习处理器的张量编译优化技术,以提高深度学习的处理速度和效率。具体而言,本次任务将重点探讨以下内容:1.深入研究DPU的基本结构和原理,了解DPU的特点和优劣势。2.深入研究深度学