用于调度分布式工作流程任务的装置和方法-豆柴文库

用于调度分布式工作流程任务的装置和方法.pdf

2023-06-25

10金币

732KB

15页

秀华****魔王

实名认证

内容提供者

1/10

2/10

3/10

4/10

5/10

6/10

7/10

8/10

9/10

10/10

亲，该文档总共15页，到这已经超出免费预览范围，如果喜欢就直接下载吧～

下载提示文本预览

如果您无法下载资料，请参考说明：

1、部分资料下载需要金币，请确保您的账户上有足够的金币

2、已购买过的文档，再次下载不重复扣费

3、资料包下载后请先用软件解压，在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN105593818A(43)申请公布日2016.05.18(21)申请号201580001459.6(51)Int.Cl.(2006.01)(22)申请日2015.09.22G06F9/46(30)优先权数据14/506,5002014.10.03US(85)PCT国际申请进入国家阶段日2016.01.26(86)PCT国际申请的申请数据PCT/US2015/0515572015.09.22(87)PCT国际申请的公布数据WO2016/053695EN2016.04.07(71)申请人数据梅尔公司地址美国加利福尼亚州(72)发明人P·沃斯K·瑙罗克M·麦克马努斯(74)专利代理机构北京市金杜律师事务所11256代理人王茂华权利要求书1页说明书9页附图4页(54)发明名称用于调度分布式工作流程任务的装置和方法(57)摘要一种服务器具有处理器和存储器，该存储器存储由处理器运行以访问调度工具的指令，该调度工具包括具有工作流程任务调度和工作流程任务依赖性的实体工作负载简档。与实体工作负载简档内的工作流程任务相关联的经处理的数据被识别。工作流程任务依赖性被分析，以更改工作流程任务调度来对依赖于经处理的数据的工作流程任务指定优先级。CN105593818ACN105593818A权利要求书1/1页1.一种服务器，包括：处理器；以及存储器，所述存储器存储由所述处理器运行以执行以下操作的指令：访问调度工具，所述调度工具包括具有工作流程任务调度和工作流程任务依赖性的实体工作负载简档，识别与所述实体工作负载简档内的工作流程任务相关联的经处理的数据，以及分析所述工作流程任务依赖性，以更改所述工作流程任务调度来对依赖于所述经处理的数据的工作流程任务指定优先级。2.根据权利要求1所述的服务器，其中所述存储器存储由所述处理器运行以选择性地将工作流程任务指派给处理资源和MapReduce处理资源的指令。3.根据权利要求1所述的服务器，其中所述存储器存储由所述处理器运行以选择性地将运行在MapReduce处理资源上的工作流程任务转变为运行在存储器中处理资源上的工作流程任务的指令。4.根据权利要求1所述的服务器，其中所述调度工具包括具有针对个体数据源的个体数据简档的数据简档存储库。5.根据权利要求4所述的服务器，其中所述个体数据简档包括列级和数据集范围的统计。6.根据权利要求4所述的服务器，其中所述个体数据简档包括针对数字和日期列的总记录计数、最小值、最大值和平均值以及指示列中的唯一值的数目的基数估计。7.根据权利要求4所述的服务器，其中所述个体数据简档包括针对最频繁值的频率估计。8.根据权利要求4所述的服务器，其中所述个体数据简档包括数据集占用空间估计。9.根据权利要求4所述的服务器，还包括由所述处理器运行以估计针对工作流程任务的数据增长和衰减模式的指令。10.根据权利要求1所述的服务器，其中所述调度工具包括用于处理与工作任务相关联的数据的子集的预览引擎。11.根据权利要求1所述的服务器，其中所述调度工具包括关于集群资源可用性的信息。12.根据权利要求1所述的服务器，其中所述调度工具包括操作符组成分析器。13.根据权利要求1所述的服务器，其中所述调度工具包括历史任务运行简档。2CN105593818A说明书1/9页用于调度分布式工作流程任务的装置和方法[0001]相关申请的交叉引用[0002]本申请要求于2014年10月3日提交的美国专利申请No.14/506,500的优先权，其内容通过引用并入本文中。技术领域[0003]本发明大体涉及计算机网络中的分布式数据处理。更具体地，本发明涉及在计算机网络中调度分布式工作流程任务。背景技术[0004]MapReduce是用于利用运行在计算机的集群上的并行的、分布式算法来处理并生成大数据集的编程模型和相关联的实施方式。MapReduce利用分布式服务器来并行地运行各种任务，同时管理系统的各个部分之间的所有通信和数据传输。这提供冗余和容错。ApacheHadoop平台是实施MapReduce的开源软件框架。假设存储在分布式文件系统中的数据为Hadoop分布式文件系统(HDFS)或其衍生系统。[0005]存储器中数据处理是快速的。ApacheSpark提供针对存储器中集群计算的基元，存储器中集群计算允许用户程序将数据加载到集群的存储器中并重复地对其查询。ApacheSpark没有依赖MapReduce范式并且在某些情况下具有快得多的性能。[0006]将令人期望的是，在运行复杂的分析工作流程的同时利用存储器中数据处理和MapReduce的强度。发明内容[0007]一种服务器具有处理器和存储器，该存储器存储由处理器运行以访问调度工具的指令，该调度工具

相关资料

用于调度分布式工作流程任务的装置和方法.pdf

一种服务器具有处理器和存储器，该存储器存储由处理器运行以访问调度工具的指令，该调度工具包括具有工作流程任务调度和工作流程任务依赖性的实体工作负载简档。与实体工作负载简档内的工作流程任务相关联的经处理的数据被识别。工作流程任务依赖性被分析，以更改工作流程任务调度来对依赖于经处理的数据的工作流程任务指定优先级。

2023-06-25

732KB

适用于分布式渲染的任务调度方法和装置.pdf

本公开提供了适用于分布式渲染的任务调度方法，接收用户提交的待渲染任务；对所述待渲染任务所需的计算资源进行判定；对满足判定的预设GPU集群调度系统中的GPU计算节点，根据任务调度算法对所述待渲染任务完成渲染操作。该方法能够解决根据待渲染任务的计算需求和GPU集群的资源使用情况合理分配实时渲染任务，具有调度策略应用的灵活性与高效性。本公开还涉及适用于分布式渲染的任务调度装置。

2024-01-06

555KB

任务分布式调度的方法和装置.pdf

本发明公开了任务分布式调度的方法和装置，涉及计算机技术领域。该方法的一具体实施方式包括：接收应用系统的待处理任务，根据待处理任务的任务信息确定待处理任务的分片总数，然后将待处理任务写入对应优先级的任务列表；任务信息包括：任务标识和优先级；异步从每个优先级的任务列表中获取任务分片放入对应优先级的任务分片调度队列；异步消费每个优先级的任务分片调度队列中的任务分片，然后调用应用系统中的程序幂等执行消费到的任务分片。该实施方式能够在复杂多变的任务分布式处理需求下，高效、健壮、平滑地支持大任务的分布式调度。

2023-06-14

1.1MB

分布式任务调度处理方法、装置和设备.pdf

本发明涉及一种分布式任务调度处理方法、装置及设备，涉及数据处理技术领域，通过设定定时器，根据定时器设定的时间，从而在启动时间在服务器集中确定并触发启动目标服务器；在包括的至少两台服务器中，可以由任一服务器进行数据分配，对目标数据进行数据切分，将切分后的子数据分发至任务接收节点，以使每个任务接收节点根据接收成功的子数据进行任务处理；每台服务器包括至少一个任务接收节点。因此，本申请中通过设置至少两台服务器，其中任一服务器均可以进行任务数据分配，通过去中心化提升了数据处理速度，无需引入复杂的开源组件，节约成本、

2023-07-21

372KB

用于任务调度的方法及装置.pdf

本申请公开了一种用于任务调度的方法及装置。方法的一具体实施方式包括：基于预设约束条件，确定可行的多种任务调度情形，其中，任务调度表征调度机器人集合中的目标机器人将货架集合中的目标货架移动至工作站集合中的目标工作站；在每种可行的任务调度情形下，确定机器人集合中的目标机器人到货架集合中匹配该目标机器人的目标货架的第一距离，每个目标货架到工作站集合中匹配该目标货架的目标工作站的第二距离以及每个目标工作站对于所需的每种物品的未满足需求量；根据每种可行的任务调度情形下的第一距离、第二距离以及未满足需求量，确定任务调

2023-07-25

909KB