特征变量分箱方法及装置.pdf
是翠****ng
亲,该文档总共12页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
相关资料
特征变量分箱方法及装置.pdf
本发明提供了一种特征变量分箱方法及装置。该方法包括:将样本数据集中任一特征变量的每个特征值分别作为特征划分点进行F评分计算,以构建F评分决策树;将所述F评分决策树的各分裂节点作为所述特征变量各个分箱的边界,得到所述特征变量的多个分箱。通过本发明,解决了相关技术中已有的决策树分箱方法的决策树生成的方法和选择最优划分方式的准则是分离的,使得生成的决策树与分箱结果之间不具有相应的分箱评价意义最优的性质的问题。
特征值分箱方法、系统及装置.pdf
本说明书中的实施例提供了特征值分箱方法、系统及装置。在联合分箱过程中,特征方的设备使用样本ID记录特征值的分箱情况,将获得的初始样本ID分箱序列发送给标签方的设备。标签方的设备基于接收到的初始样本ID分箱序列继续进行有监督分箱,获得满足终止分箱条件的目标样本ID分箱序列,并将目标样本ID分箱序列反馈给特征方的设备。最终,特征方的设备可将目标样本ID分箱序列转化为目标特征值分箱序列,即完成对样本集中各样本特征值的分箱,以便后续的模型训练。如此,可以有效保护特征方和标签方各自的数据隐私。
基于隐私保护的联合特征分箱方法及装置.pdf
本说明书实施例提供了一种基于隐私保护的联合特征分箱方法及装置。双方各自存储有隐私数据。标签持有方将同态加密后的N个第一加密标签值和生成的范围证明发送至特征持有方;特征持有方在基于范围证明验证通过后将N个第一加密标签值与N个特征值进行关联,并对N个特征值按照值大小重新排序,得到按照更新顺序排列的N个特征值构成的第一序列和N个第二加密标签值构成的第二序列,并将第二序列发送至标签持有方;标签持有方对第二序列中的第二加密标签值进行解密,得到各个初始分箱中的原始标签值,并基于此进行特征分箱,得到第一分箱结果,并发送
基于隐私保护的有监督特征分箱方法及装置.pdf
本说明书实施例提供了一种基于隐私保护的有监督特征分箱方法及装置。双方各自存储有隐私数据。标签持有方将同态加密后的N个第一加密标签值发送至特征持有方;特征持有方将N个第一加密标签值与N个特征值进行关联,并对N个特征值按照值大小重新排序,得到按照更新顺序排列的N个特征值构成的第一序列和N个第二加密标签值构成的第二序列,并将第二序列发送至标签持有方;标签持有方对第二序列中的第二加密标签值进行解密,得到各个初始分箱中的原始标签值,并基于此进行特征分箱,得到第一分箱结果,并发送至特征持有方;特征持有方再根据第一分箱
特征分箱方法、装置、电子设备及存储介质.pdf
本发明涉及数据处理领域,揭露一种特征分箱方法,包括:采用第一分箱方法和第一分箱数量对第一样本集中每个第一特征执行分箱操作,得到第一分箱结果;接收第二参与方发送的各个第二特征分箱后的每个第二箱子中各个样本的标签密文的和,标签密文的和是采用第二分箱方法和第二分箱数量对第二样本集中每个第二特征执行分箱操作后计算得到的;当判断第一、第二分箱结果合理时,挑选第一、第二目标特征,对第一目标特征编码,得到分箱后的数据,将第二目标特征发送给第二参与方,以供第二参与方对其编码,完成分箱。本发明还提供一种特征分箱装置、电子设