特征值分箱方法、系统及装置.pdf
俊英****22
亲,该文档总共16页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
相关资料
特征值分箱方法、系统及装置.pdf
本说明书中的实施例提供了特征值分箱方法、系统及装置。在联合分箱过程中,特征方的设备使用样本ID记录特征值的分箱情况,将获得的初始样本ID分箱序列发送给标签方的设备。标签方的设备基于接收到的初始样本ID分箱序列继续进行有监督分箱,获得满足终止分箱条件的目标样本ID分箱序列,并将目标样本ID分箱序列反馈给特征方的设备。最终,特征方的设备可将目标样本ID分箱序列转化为目标特征值分箱序列,即完成对样本集中各样本特征值的分箱,以便后续的模型训练。如此,可以有效保护特征方和标签方各自的数据隐私。
特征变量分箱方法及装置.pdf
本发明提供了一种特征变量分箱方法及装置。该方法包括:将样本数据集中任一特征变量的每个特征值分别作为特征划分点进行F评分计算,以构建F评分决策树;将所述F评分决策树的各分裂节点作为所述特征变量各个分箱的边界,得到所述特征变量的多个分箱。通过本发明,解决了相关技术中已有的决策树分箱方法的决策树生成的方法和选择最优划分方式的准则是分离的,使得生成的决策树与分箱结果之间不具有相应的分箱评价意义最优的性质的问题。
基于隐私保护的联合特征分箱方法及装置.pdf
本说明书实施例提供了一种基于隐私保护的联合特征分箱方法及装置。双方各自存储有隐私数据。标签持有方将同态加密后的N个第一加密标签值和生成的范围证明发送至特征持有方;特征持有方在基于范围证明验证通过后将N个第一加密标签值与N个特征值进行关联,并对N个特征值按照值大小重新排序,得到按照更新顺序排列的N个特征值构成的第一序列和N个第二加密标签值构成的第二序列,并将第二序列发送至标签持有方;标签持有方对第二序列中的第二加密标签值进行解密,得到各个初始分箱中的原始标签值,并基于此进行特征分箱,得到第一分箱结果,并发送
一种数据分箱方法及装置.pdf
本发明公开了一种数据分箱方法及装置,所述方法包括:根据预设的排序规则及全量样本数据中每个正样本数据的属性值,对所述正样本数据进行排序;根据待分箱的目标数量,将排序后的所述正样本数据均分为多个组,其中,每个组的正样本数据归属于一个分箱,分组的数量与所述目标数量相同;针对每个分箱,根据该分箱中每个正样本数据的属性值,确定该分箱的目标属性值区间;根据确定的每个分箱的目标属性值区间,及全量样本数据中每个负样本数据的属性值,对所述负样本数据进行分箱。提供了一种保证每个分箱中正样本数据的数量基本一致,避免不同分箱中正
基于隐私保护的有监督特征分箱方法及装置.pdf
本说明书实施例提供了一种基于隐私保护的有监督特征分箱方法及装置。双方各自存储有隐私数据。标签持有方将同态加密后的N个第一加密标签值发送至特征持有方;特征持有方将N个第一加密标签值与N个特征值进行关联,并对N个特征值按照值大小重新排序,得到按照更新顺序排列的N个特征值构成的第一序列和N个第二加密标签值构成的第二序列,并将第二序列发送至标签持有方;标签持有方对第二序列中的第二加密标签值进行解密,得到各个初始分箱中的原始标签值,并基于此进行特征分箱,得到第一分箱结果,并发送至特征持有方;特征持有方再根据第一分箱