预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共55页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN114139714A(43)申请公布日2022.03.04(21)申请号202110884528.XG06N3/08(2006.01)(22)申请日2021.08.03(30)优先权数据17/013,2582020.09.04US(71)申请人英特尔公司地址美国加利福尼亚州(72)发明人徐笑凡科马克·布瑞克佐尔特·比罗(74)专利代理机构北京东方亿思知识产权代理有限责任公司11258代理人张敏(51)Int.Cl.G06N20/00(2019.01)G06N3/063(2006.01)G06N3/04(2006.01)权利要求书3页说明书31页附图20页(54)发明名称用于硬件感知的机器学习模型训练的方法和装置(57)摘要本公开涉及用于硬件感知的机器学习模型训练的方法和装置。公开了用于硬件感知的机器学习模型训练的方法、装置、系统和制品。一种示例装置包括:配置确定器,用于确定要在其上执行机器学习模型的目标硬件平台的硬件配置;层生成器,用于基于硬件配置来向机器学习模型的层指派稀疏配置;以及部署控制器,用于响应于机器学习模型的输出满足各个阈值而将机器学习模型部署到目标硬件平台,所述输出包括在所述层具有指派的稀疏配置的情况下执行机器学习模型的时钟周期的数量。CN114139714ACN114139714A权利要求书1/3页1.一种用于训练机器学习模型的装置,该装置包括:配置确定器,用于确定要在其上执行所述机器学习模型的目标硬件平台的硬件配置;层生成器,用于基于所述硬件配置来向所述机器学习模型的层指派稀疏配置;以及部署控制器,用于响应于所述机器学习模型的输出满足各个阈值而将所述机器学习模型部署到所述目标硬件平台,所述输出包括在所述层具有指派的稀疏配置的情况下执行所述机器学习模型的时钟周期的数量。2.如权利要求1所述的装置,其中所述层生成器选择所述层中的第一层并且将零指派给所述第一层的矩阵的一个或多个值,并且所述装置还包括模型训练处理器,用于确定利用所述矩阵执行卷积操作的时钟周期的第一数量。3.如权利要求1所述的装置,其中所述输出包括所述机器学习模型的准确度,所述各个阈值是预定的,所述各个阈值包括准确度阈值和时钟周期阈值,并且所述装置还包括:模型训练处理器,用于:确定所述准确度是否满足所述准确度阈值;并且确定所述时钟周期的数量是否满足所述时钟周期阈值;以及部署控制器,用于:响应于以下所列项中的至少一者而重训练所述机器学习模型:(a)所述准确度不满足所述准确度阈值,或者(b)所述时钟周期的数量不满足所述时钟周期阈值;并且响应于以下所列项中的至少一者而识别所述机器学习模型以进行部署:(a)所述准确度满足所述准确度阈值,并且(b)所述时钟周期的数量满足所述时钟周期阈值。4.如权利要求1‑2中任一项所述的装置,其中所述硬件配置包括与所述目标硬件平台相关联的存储器配置信息、缓存配置信息或者处理配置信息中的至少一者。5.如权利要求1‑2中任一项所述的装置,其中所述硬件配置指定以下所列项中的至少一者:与所述目标硬件平台的缓存存储器相关联的缓存大小或者缓存操作频率。6.如权利要求1‑2中任一项所述的装置,其中所述硬件配置指定以下所列项中的至少一者:与所述目标硬件平台的存储器相关联的存储器类型、读存储器带宽、读总线宽度、写存储器带宽、写总线宽度、存储器减额因子或者存储器端口的数目。7.如权利要求1‑2中任一项所述的装置,其中所述硬件配置指定以下所列项中的至少一者:与所述目标硬件平台的一个或多个处理器相关联的数据处理单元的数目、时钟频率、架构频率、激活精度或者权重精度。8.如权利要求1‑2中任一项所述的装置,其中所述目标硬件平台是数字信号处理器、图形处理单元或者视觉处理单元。9.一种用于训练机器学习模型的装置,该装置包括:用于确定要在其上执行所述机器学习模型的目标硬件平台的硬件配置的装置;用于基于所述硬件配置来向所述机器学习模型的层指派稀疏配置的装置;以及用于响应于所述机器学习模型的输出满足各个阈值而将所述机器学习模型部署到所述目标硬件平台的装置,所述输出包括在所述层具有指派的稀疏配置的情况下执行所述机器学习模型的时钟周期的数量。10.如权利要求9所述的装置,其中所述用于确定的装置是用于确定的第一装置,所述用于指派的装置用于选择所述层中的第一层并且将零指派给所述第一层的矩阵的一个或2CN114139714A权利要求书2/3页多个值,并且所述装置还包括用于确定利用所述矩阵执行卷积操作的时钟周期的第一数量的第二装置。11.如权利要求9所述的装置,其中所述用于确定的装置是用于确定的第一装置,所述输出包括所述机器学习模型的准确度,所述各个阈值是预定的,所述各个阈值包括准确度阈值和时钟周期阈