一种数据分箱方法及装置.pdf
梦影****主a
亲,该文档总共14页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
相关资料
一种数据分箱方法及装置.pdf
本发明公开了一种数据分箱方法及装置,所述方法包括:根据预设的排序规则及全量样本数据中每个正样本数据的属性值,对所述正样本数据进行排序;根据待分箱的目标数量,将排序后的所述正样本数据均分为多个组,其中,每个组的正样本数据归属于一个分箱,分组的数量与所述目标数量相同;针对每个分箱,根据该分箱中每个正样本数据的属性值,确定该分箱的目标属性值区间;根据确定的每个分箱的目标属性值区间,及全量样本数据中每个负样本数据的属性值,对所述负样本数据进行分箱。提供了一种保证每个分箱中正样本数据的数量基本一致,避免不同分箱中正
保护隐私数据的有监督特征分箱方法及装置.pdf
本说明书实施例提供了一种保护隐私数据的有监督特征分箱方法及装置。标签持有方将通过同态加密后的N个第一加密标签值发送至特征持有方;特征持有方,按照既定顺序,将N个第一加密标签值与N个特征值进行关联,并对N个特征值按照值大小重新排序,得到按照更新顺序排列的N个特征值构成的第一序列,通过变换随机数将对应的第一加密标签值变换为第二加密标签值,并得到按照更新顺序排列的N个第二加密标签值构成的第二序列,至少将第二序列发送至标签持有方;标签持有方至少基于第二序列进行特征分箱,得到第一分箱结果,并发送至特征持有方;特征持
特征变量分箱方法及装置.pdf
本发明提供了一种特征变量分箱方法及装置。该方法包括:将样本数据集中任一特征变量的每个特征值分别作为特征划分点进行F评分计算,以构建F评分决策树;将所述F评分决策树的各分裂节点作为所述特征变量各个分箱的边界,得到所述特征变量的多个分箱。通过本发明,解决了相关技术中已有的决策树分箱方法的决策树生成的方法和选择最优划分方式的准则是分离的,使得生成的决策树与分箱结果之间不具有相应的分箱评价意义最优的性质的问题。
分箱数据的处理方法、装置、设备、存储介质及程序产品.pdf
本发明公开了一种分箱数据的处理方法、装置、设备、存储介质及程序产品,其中方法包括:获取目标变量提供方发送的多个数据ID以及每个数据ID对应的加密后的目标变量、加密后的相反变量,计算每一分箱对应的加密后的正样本占比和加密后的负样本占比,并将加密后的正样本占比和负样本占比分别与对应的随机数相乘,将相乘结果发送给目标变量提供方,获取目标变量提供方根据相乘结果确定的各个分箱对应的中间结果,根据多个分箱对应的中间结果以及对应的随机数,将加密后的信息价值和/或对证据权重增加随机数后得到的结果发送给目标变量提供方。本发
一种皮带分箱装置.pdf
本发明公开了一种能有效避免在输送过程中发生纸箱滞留或纸箱倾倒现象、从而大大提高纸箱输送效率的皮带分箱装置,包括:在机架上依次设置的前、后滚筒输送机构以及能驱动前、后滚筒输送机构分别以不同速度输送的分箱驱动装置,前、后滚筒输送机构的结构均包括:两根被动滚筒,两根被动滚筒之间并排设置有若干无动力滚筒,被动滚筒和无动力滚筒下方的机架上设置有主动滚筒,前、后滚筒输送机构中的主动滚筒、被动滚筒和无动力滚筒上分别设置有前、后输送皮带,两输送皮带的输送平面等高;前、后滚筒输送机构中相邻的两被动滚筒紧邻设置。本发明适用于