预览加载中,请您耐心等待几秒...
1/3
2/3
3/3

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

基于任务复制的容错并行任务调度研究与实现的任务书 任务书:基于任务复制的容错并行任务调度研究与实现 一、研究背景 随着计算机技术的不断发展,大规模并行处理已经成为了科学计算和数据处理领域的重要手段。而并行任务调度是大规模并行处理中非常重要的一环,它能够对系统资源进行合理的分配和利用,提高系统的计算效率和性能。 然而,在大规模并行处理中存在着硬件故障、软件错误等因素,这些因素会影响系统的正常运行。因此,在进行并行任务调度的过程中要考虑到容错问题,即在出现故障的情况下能够继续保证任务的正常执行。 本研究将会通过分析任务复制、容错技术等相关理论,提出一种基于任务复制的容错并行任务调度算法,并进行实现和测试,以期能够提高并行计算系统的容错性和性能。 二、研究目的 本研究的主要目的是: 1.分析现有的并行任务调度算法及其容错性能; 2.提出一种基于任务复制的容错并行任务调度算法; 3.实现并测试该算法,验证其在容错性和性能方面的优势。 三、研究内容 1.分析并总结现有的并行任务调度算法及其容错性能。通过对现有算法的文献研究和整理,认识并总结不同算法的优缺点,并分析它们在容错性方面的局限性和不足。 2.基于任务复制提出一种容错并行任务调度算法。通过对任务复制技术和容错技术的研究和理解,提出一种基于任务复制的容错并行任务调度算法。该算法在任务调度时,将任务分为多个副本,在某个副本出现故障时,能够转移到其它副本上继续执行。 3.实现并测试容错并行任务调度算法。利用C++等编程语言,根据算法设计制作实现程序,并在不同规模的并行计算集群上进行测试。通过对测试结果的分析和统计,验证该算法在容错性和性能方面的优势。 四、研究成果 通过本研究,期望得到以下成果: 1.分析并总结现有的并行任务调度算法及其容错性能,为后续研究提供参考; 2.提出一种基于任务复制的容错并行任务调度算法,能够在出现故障时动态切换任务执行节点,实现容错处理; 3.实现并测试任务调度算法,验证其在真实环境下的容错性和性能,为后续研究提供实验基础。 五、研究方法 1.文献研究法。通过对现有并行任务调度算法和容错技术的文献研究,总结不同算法的特点和适用情况,为后续研究提供理论依据。 2.算法设计法。基于任务复制技术,设计容错并行任务调度算法,考虑容错问题和资源利用效率,确保算法能够实现正确有效地执行。 3.实验研究法。利用C++等编程语言,实现算法;通过在并行计算集群上的实验测试,验证算法在容错性和性能方面的有效性和优势。 六、进度安排 研究时间:共计12周 第1-2周:文献研究、初步设计任务调度算法 第3-6周:详细设计算法,完成算法实现的编码工作 第7-9周:编写实验程序,使用模拟器对程序进行验证 第10-11周:在实验环境下测试程序,收集实验结果 第12周:总结研究成果,撰写毕业论文、课程报告等相关文献 七、参考文献 1.TanY,HuangWD.Asurveyoffault-tolerancetechniquesinparallelanddistributedsystems[J].IBMJournalofResearchandDevelopment,1995,39(4):455-463. 2.AgbariaA,GaoGR.TaskReplication:ANewApproachtoFault-TolerantSchedulinginGridEnvironments[C]//17thInternationalConferenceonParallelandDistributedSystems(ICPADS).2011:71-78. 3.KumarVS,NarasimhanS,SekarRC.Faulttolerantheuristicsforschedulingparalleltaskgraphsonheterogeneoussystems[J].IEEETransactionsonParallelandDistributedSystems,2002,13(7):742-751. 4.DufresneD,GodinC.Areviewofcheckpoint/restartsolutionsforparallelapplications[J].InternationalJournalofHighPerformanceComputingApplications,2004,18(4):499-516. 5.AgrawalH,UngureanuC,KettimuthuR,etal.FailurepredictionandmitigationforHPCsystemsandapplications:overviewandopportunities[J].JournalofPhysics:C