保护隐私数据的有监督特征分箱方法及装置.pdf
醉香****mm
亲,该文档总共33页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
相关资料
保护隐私数据的有监督特征分箱方法及装置.pdf
本说明书实施例提供了一种保护隐私数据的有监督特征分箱方法及装置。标签持有方将通过同态加密后的N个第一加密标签值发送至特征持有方;特征持有方,按照既定顺序,将N个第一加密标签值与N个特征值进行关联,并对N个特征值按照值大小重新排序,得到按照更新顺序排列的N个特征值构成的第一序列,通过变换随机数将对应的第一加密标签值变换为第二加密标签值,并得到按照更新顺序排列的N个第二加密标签值构成的第二序列,至少将第二序列发送至标签持有方;标签持有方至少基于第二序列进行特征分箱,得到第一分箱结果,并发送至特征持有方;特征持
基于隐私保护的有监督特征分箱方法及装置.pdf
本说明书实施例提供了一种基于隐私保护的有监督特征分箱方法及装置。双方各自存储有隐私数据。标签持有方将同态加密后的N个第一加密标签值发送至特征持有方;特征持有方将N个第一加密标签值与N个特征值进行关联,并对N个特征值按照值大小重新排序,得到按照更新顺序排列的N个特征值构成的第一序列和N个第二加密标签值构成的第二序列,并将第二序列发送至标签持有方;标签持有方对第二序列中的第二加密标签值进行解密,得到各个初始分箱中的原始标签值,并基于此进行特征分箱,得到第一分箱结果,并发送至特征持有方;特征持有方再根据第一分箱
基于隐私保护的联合特征分箱方法及装置.pdf
本说明书实施例提供了一种基于隐私保护的联合特征分箱方法及装置。双方各自存储有隐私数据。标签持有方将同态加密后的N个第一加密标签值和生成的范围证明发送至特征持有方;特征持有方在基于范围证明验证通过后将N个第一加密标签值与N个特征值进行关联,并对N个特征值按照值大小重新排序,得到按照更新顺序排列的N个特征值构成的第一序列和N个第二加密标签值构成的第二序列,并将第二序列发送至标签持有方;标签持有方对第二序列中的第二加密标签值进行解密,得到各个初始分箱中的原始标签值,并基于此进行特征分箱,得到第一分箱结果,并发送
基于数据隐私保护的机器学习模型特征筛选方法及装置.pdf
本说明书实施例提供用于基于数据隐私保护的机器学习模型特征筛选的方法。机器学习模型具有模型特征集,并且机器学习模型的特征数据被水平切分地分布在第一数据拥有方和至少一个第二数据拥有方处,每个数据拥有方具有与模型特征集对应的特征数据。第一数据拥有方和至少一个第二数据拥有方协同来使用第一数据拥有方的特征数据进行多方安全计算,以训练出待筛选模型特征的预测模型。在第一数据拥有方处,基于待筛选模型特征的预测差值确定待筛选模型特征的方差膨胀因子,以用于对待筛选模型特征进行模型特征筛选处理。
特征变量分箱方法及装置.pdf
本发明提供了一种特征变量分箱方法及装置。该方法包括:将样本数据集中任一特征变量的每个特征值分别作为特征划分点进行F评分计算,以构建F评分决策树;将所述F评分决策树的各分裂节点作为所述特征变量各个分箱的边界,得到所述特征变量的多个分箱。通过本发明,解决了相关技术中已有的决策树分箱方法的决策树生成的方法和选择最优划分方式的准则是分离的,使得生成的决策树与分箱结果之间不具有相应的分箱评价意义最优的性质的问题。