预览加载中,请您耐心等待几秒...
1/9
2/9
3/9
4/9
5/9
6/9
7/9
8/9
9/9

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN106708626A(43)申请公布日2017.05.24(21)申请号201611187228.1(22)申请日2016.12.20(71)申请人北京工业大学地址100124北京市朝阳区平乐园100号(72)发明人方娟刘士建程妍瑾常泽清(74)专利代理机构北京思海天达知识产权代理有限公司11203代理人张慧(51)Int.Cl.G06F9/50(2006.01)G06F15/173(2006.01)权利要求书1页说明书5页附图2页(54)发明名称一种面向低功耗的异构多核共享cache划分方法(57)摘要本发明公开一种面向低功耗的异构多核共享cache划分方法,首先进行共享末级缓存L2级Cache的静态划分,分配恒定比例50%的缓存空间给CPU应用,剩余空间留给GPU应用。均分比例划分的基础上,进行最优静态比例的划分,划分不等比例给CPU和GPU应用。最后,进行动态地自适应比例划分机制,利用面向低功耗的动态划分算法,根据IPC划分指标在运行时动态地改变CPU应用和GPU应用占有末级缓存的比例,从而达到降低系统功耗,提升系统性能的目的。CN106708626ACN106708626A权利要求书1/1页1.一种面向低功耗的异构多核共享cache划分方法,其特征在于,包括以下步骤:步骤1,实现CPU请求与GPU请求区分,跟踪访存请求,使用标志位TagID来区分不同核心的访存请求;步骤2,根据不同核心访存请求的标志位TagID决定访存请求映射到的L2Cache地址;步骤3,实现静态划分,包括以下步骤:步骤3.1,等量均分在L2Cache的请求缓冲队列L1RequestToL2Cache中,判断TagID消息标志位,如果该请求是来自GPU核心的L1级Cache,将该访存请求映射到奇地址,如果该请求是来自CPU核心的L1级Cache,将该访存请求映射到偶地址;步骤3.2,最优划分,在均分的基础上,逐步改变分配给CPU和GPU应用的缓存地址比例,统计共享缓存CPU和GPU程序各自的单位周期内执行的指令数量(InstructionsPerCycle简称IPC),找到性能最优功耗最低的划分比例;步骤4,实现动态自适应划分步骤2,3中的CPU与GPU末级缓存占比是在应用程序运行之前划分好的,在运行中不会根据应用程序的特征进行动态调整。动态划分在运行时收集CPU核和GPU核访存请求的特征,实现自适应动态划分。2.如权利要求1所述的面向低功耗的异构多核共享cache划分方法,其特征在于,步骤4具体包括:步骤4.1,监控访存请求,分别获取CPU应用程序和GPU应用程序的访存行为信息。分别统计CPU应用程序的IPC和GPU应用程序的IPC值;步骤4.2,根据GPU的IPC指标,计算应用程序的性能增益σ,将Cache列(Cacheway)划分给性能增益最大的应用;步骤4.3,周期性执行步骤4.1,4.2,根据当前周期GPU的访存信息,计算GPU应用的IPC增益值,在下一个周期开始时将分配Cache列给相应的应用程序。3.如权利要求1所述的面向低功耗的异构多核共享cache划分方法,其特征在于,步骤4.2具体包括具体方法如下:,设Thresholdlow为阈值评测的下界值,Thresholdhigh为阈值评测的上界值,1、如果所述GPU的IPC增益值σ小于阈值Thresholdlow,GPU应用程序为缓存不敏感型,将Cache列划分给CPU应用程序。2、如果所述GPU的IPC增益值σ大于等于阈值Thresholdlow,小于等于阈值Thresholdhigh,GPU应用程序为缓存敏感型,分配给GPU应用程序能带来更大的收益,将Cache列划分给GPU应用程序。3、如果所述GPU的IPC增益值σ大于等于阈值Thresholdhigh,GPU应用程序发生阶段性变化,恢复缓存划分至初始状态。2CN106708626A说明书1/5页一种面向低功耗的异构多核共享cache划分方法技术领域[0001]本发明属于计算机体系缓存系统结构领域,具体涉及一种面向低功耗的异构多核共享cache划分方法。背景技术[0002]随着多核处理器的不断发展,传统的多核架构难以满足大规模计算的需求,工业界通过整合不同类型的处理器于同一个芯片上,形成了异构多核处理器架构。异构多核处理器(HMP-HeterogeneousMulti-coreProcessor)将具有不同计算能力的处理器融合到一起,被广泛应用于航空航天、工业控制、仪器仪表等行业,以满足系统性能需求,降低功耗和成本。HMP由于集成了不同特点和性能的处理器核,可将不同类型的计算任务分配到不同类型的处理器核上并行处理,比如,快速复杂的核能执行串行代码部分,而