预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共17页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN114139636A(43)申请公布日2022.03.04(21)申请号202111469624.4(22)申请日2021.12.03(71)申请人中国建设银行股份有限公司地址100033北京市西城区金融大街25号(72)发明人黄立王毅(74)专利代理机构北京集佳知识产权代理有限公司11227代理人张倩(51)Int.Cl.G06K9/62(2022.01)权利要求书3页说明书9页附图4页(54)发明名称异常作业处理方法及装置(57)摘要本发明提供了一种异常作业处理方法及装置,该方法包括:响应于检测指令,确定批量作业中的处于异常状态的目标作业;对所述目标作业的作业标识进行特征提取,获得所述作业标识对应的作业标识特征;将所述作业标识特征输入至预先构建的决策树模型,得到所述决策树模型输出的决策结果;根据所述决策结果确定所述批量作业中与所述目标作业的异常状态相关联的作业。应用本发明提供的异常作业处理方法,能够快速确定与目标作业的异常状态相关联的作业,从而可以确定出异常作业的影响范围,能够快速评估异常作业对整个批量以及业务系统的影响程度。CN114139636ACN114139636A权利要求书1/3页1.一种异常作业处理方法,其特征在于,包括:响应于检测指令,确定批量作业中的处于异常状态的目标作业;对所述目标作业的作业标识进行特征提取,获得所述作业标识对应的作业标识特征;将所述作业标识特征输入至预先构建的决策树模型,得到所述决策树模型输出的决策结果;根据所述决策结果确定所述批量作业中与所述目标作业的异常状态相关联的作业。2.根据权利要求1所述的方法,其特征在于,所述决策树模型的构建过程,包括:获取所述批量作业的调度日志;基于所述批量作业中的各个作业之间的依赖关系,对所述调度日志进行关键字提取,获得各个作业关键字;对每个所述作业关键字进行特征提取,得到每个所述作业关键字对应的训练样本;将各个所述训练样本组成训练样本集,并将所述训练样本集放入预设的根节点;从放入所述根节点的所述训练样本集中选择一个最优特征;根据所述最优特征对所述训练数据集进行分割得到多个训练数据子集;对每个所述训练子执行第一操作;所述第一操作包括:在各个所述训练数据子集满足预设的分类条件的情况下,构建每个所述训练数据子集对应的叶子节点,并将每个所述训练数据子集放入其对应的叶子节点中;对于每个所述叶子节点,对放入所述叶子节点的所述训练数据子集进行最优特征选取,若成功在所述训练数据子集中选取出新的最优特征,则基于所述新的最优对所述训练数据子集进行分割,得到多个新的训练数据子集;对每个所述新的训练数据子集重新执行所述第一操作,直至新的训练数据子集满足预设的停止迭代条件,以构建得到决策树模型,所述停止迭代条件包括:所有训练数据子集均已放入其各自对应的叶子节点中,或在新的训练数据子集中未成功选取出新的最优特征。3.根据权利要求2所述的方法,其特征在于,所述从放入所述根节点的所述训练样本集中选择一个最优特征,包括:确定所述训练样本集中的每一训练样本的基尼系数;将基尼系数最小的训练样本作为最优特征。4.根据权利要求2所述的方法,其特征在于,在构建得到所述决策树模型之后,还包括:基于预设的剪枝损失函数对所述决策树模型进行修剪优化,得到优化后的决策树模型。5.根据权利要求4所述的方法,其特征在于,所述基于预设的剪枝损失函数对所述决策树模型进行修剪优化,得到优化后的决策树模型,包括:利用所述剪枝损失函数对所述决策树模型的各个节点进行计算,得到每个所述节点的损失函数值、叶子节点数量以及正则化阈值;在各个所述正则化阈值中选取出数值最大的正则化阈值作为目标正则化阈值;基于每个所述节点的损失函数值、叶子节点数量以及目标正则化阈值,对所述决策树模型进行剪枝,得到所述决策树的最优子树集合;在所述最优子树集合中选取出目标子树;将所述目标子树作为优化后的决策树模型。2CN114139636A权利要求书2/3页6.一种异常作业处理装置,其特征在于,包括:第一确定单元,用于响应检测指令,确定批量作业中的处于异常状态的目标作业;第一执行单元,用于对所述目标作业的作业标识进行特征提取,获得所述作业标识对应的作业标识特征;第二执行单元,用于将所述作业标识特征输入至预先构建的决策树模型,得到所述决策树模型输出的决策结果;第二确定单元,用于根据所述决策结果确定所述批量作业中与所述目标作业的异常状态相关联的作业。7.根据权利要求6所述的装置,其特征在于,所述第二执行单元,包括:获取子单元,用于获取所述批量作业的调度日志;第一执行子单元,用于基于所述批量作业中的各个作业之间的依赖关系,对所述调度日志进行关键字提取,获得各个作业关键字;第二执行子单