预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共16页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113837863A(43)申请公布日2021.12.24(21)申请号202111138614.2(22)申请日2021.09.27(71)申请人上海冰鉴信息科技有限公司地址200000上海市浦东新区中国(上海)自由贸易试验区商城路618号四层B207室(72)发明人顾凌云谢旻旗张涛黄以增(74)专利代理机构成都顶峰专利事务所(普通合伙)51224代理人杨俊华(51)Int.Cl.G06Q40/02(2012.01)G06Q30/02(2012.01)G06Q10/04(2012.01)权利要求书2页说明书10页附图3页(54)发明名称一种业务预测模型创建方法、装置及计算机可读存储介质(57)摘要本申请提供的业务预测模型创建方法、装置及计算机可读存储介质,首先,找到与目标数据集类似的多个辅助数据集;接着,从多个辅助数据集中进行抽样得到样本数据集,并通过样本数据集训练得到一业务状态模型;再接着,通过业务状态模型得到违约概率,并基于违约概率确定建模数据集;然后,基于目标数据集及建模数据集,确定权重参数;最后,建模数据集及权重参数创建业务预测模型。本方案通过使用与目标数据集类似的辅助数据集,通过量化方式筛选出建模数据集,并对建模数据集中的样本权重进行调整,以使建模数据集中的样本更加接近待创建业务预测模型所对应业务的样本,能使创建的业务预测模型具有更强的预测能力和稳定性。CN113837863ACN113837863A权利要求书1/2页1.一种业务预测模型创建方法,其特征在于,应用于计算机设备,所述方法包括:获取待创建业务预测模型的目标数据集;基于所述目标数据集,获取与所述目标数据集满足预设业务相似条件的多个辅助数据集;从所述多个辅助数据集中抽取样本数据,得到样本数据集;根据所述样本数据集训练得到一用于对所述样本数据中的业务对象进行业务状态预测的业务状态模型;采用所述业务状态模型对所述目标数据集及多个辅助数据集进行预测,得到所述目标数据集及每个辅助数据集的违约概率;基于所述目标数据集及每个辅助数据集的违约概率,从所述样本数据集中确定出建模数据集;根据所述目标数据集及所述建模数据集,确定权重参数;基于所述建模数据集及所述权重参数创建所述业务预测模型。2.如权利要求1所述的业务预测模型创建方法,其特征在于,在所述基于所述目标数据集,获取与所述目标数据集满足预设业务相似条件的多个辅助数据集的步骤中,所述预设业务相似条件包括:每个辅助数据集与所述目标数据集具有相同可用于创建所述业务预测模型的预测变量;和,所述每个辅助数据集的样本数据包括业务对象的业务状态标签。3.如权利要求1所述的业务预测模型创建方法,其特征在于,所述从所述多个辅助数据集中抽取样本数据,得到样本数据集的步骤,包括:从每个辅助数据集中抽取相同预设数量的样本数据,得到所述样本数据集;其中,所述从每个辅助数据集中抽取相同预设数量的样本数据的步骤包括:检测每个辅助数据集中的样本数据的数量是否大于所述预设数量;若检测到大于等于所述预设数量,则采用无放回抽样方式从所述每个辅助数据集中抽取所述预设数量的样本数据;若检测到小于所述预设数量,则采用有放回抽样方式从所述每个辅助数据集中抽取所述预设数量的样本数据。4.如权利要求1所述的业务预测模型创建方法,其特征在于,所述基于所述目标数据集及每个辅助数据集的违约概率,从所述样本数据集中确定出建模数据集的步骤,包括:将所述目标数据集的违约概率作为基础数据,将所述多个辅助数据集的违约概率作为测试数据,根据所述基础数据与所述测试数据计算各个辅助数据集的群体稳定性指标;将所述群体稳定性指标中指标数值最小的辅助数据集作为所述建模数据集。5.如权利要求4所述的业务预测模型创建方法,其特征在于,在所述根据所述基础数据与所述测试数据计算各个辅助数据集的群体稳定性指标的步骤中,将所述基础数据进行分组,并按照所述基础数据的分组的阈值标准将所述测试数据进行分组,其中,所述基础数据的分组数量与所述测试数据的分组数量相同;群体稳定性指标psi的计算公式如下:2CN113837863A权利要求书2/2页其中,n为分组数量,i为分组的序号,Ai为所述测试数据中第i组的组内样本所占比例,Ei为所述基础数据中第i组的组内样本所占比例。6.如权利要求5所述的业务预测模型创建方法,其特征在于,在所述根据所述目标数据集及所述建模数据集,确定权重参数的步骤中,确定所述权重参数的公式如下:其中,β是一个一维权重参数数组,一维权重参数数组包括权重参数β1、β2…βj,m是所述建模数据集的样本个数,x’j为第j个所述建模数据集的样本,n是所述目标数据集的样本个数,xi为第i个所述目标数据集的样本,Φ代表欧拉公式,二