预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共21页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN115828174A(43)申请公布日2023.03.21(21)申请号202211555885.2(22)申请日2022.12.06(71)申请人中移信息技术有限公司地址518048广东省深圳市福田区新洲国通大厦滨河大道9023号申请人中国移动通信集团有限公司(72)发明人王倩臧思聪李冰景昕杨猛陶涛徐海勇(74)专利代理机构北京东方亿思知识产权代理有限责任公司11258专利代理师张卉雨(51)Int.Cl.G06F18/2431(2023.01)G06Q10/04(2023.01)G06Q30/016(2023.01)权利要求书2页说明书15页附图3页(54)发明名称模型构建方法、装置、设备、介质和产品(57)摘要本申请公开了一种模型构建方法、装置、设备、介质和产品。该模型构建方法包括:获取多个用户的特征数据;其中,每个用户具有多个特征数据;每个所述特征数据为所述用户投诉的业务所对应的数据;基于各用户的所述特征数据,以及距离哈希函数,得到哈希函数族;基于所述哈希函数族,构建哈希树;基于多个哈希树,构建距离哈希森林;以基于所述距离哈希森林预测待检测用户是否为待投诉用户。根据本申请实施例,无需确定该用户是否为投诉用户,这样可不需要对投诉用户添加标签,实现无监督学习,得到预测待投诉用户的模型,提升了投诉用户预测的精确性。CN115828174ACN115828174A权利要求书1/2页1.一种模型构建方法,其特征在于,所述方法包括:获取多个用户的特征数据;其中,每个用户具有多个特征数据;每个所述特征数据为所述用户投诉的业务所对应的数据;基于各用户的所述特征数据,以及距离哈希函数,得到哈希函数族;基于所述哈希函数族,构建哈希树;基于多个哈希树,构建距离哈希森林;以基于所述距离哈希森林预测待检测用户是否为待投诉用户。2.根据权利要求1所述的方法,其特征在于,在所述获取多个用户的特征数据之后,所述方法还包括:针对每个用户的多个所述特征数据,对各所述特征数据进行预处理,得到目标特征数据;所述基于各用户的所述特征数据,以及距离哈希函数,得到哈希函数族,包括:基于目标特征数据,以及距离哈希函数,得到哈希函数族。3.根据权利要求2所述的方法,其特征在于,所述对各用户的所述特征数据进行预处理,得到目标特征数据,包括:针对每个用户的各所述特征数据执行如下操作,得到第一目标特征数据:针对具有缺失值的第一特征数据,将所述第一特征数据删除;其中,所述第一特征数据为用于表征所述用户的属性特征的数据;针对具有缺失值的第二特征数据,将所述第二特征数据利用预设数值进行填充;其中,所述第二特征数据用于表征所述用户定制的业务数据,以及所述用户的消费数据;针对不合规的第三特征数据,将所述第三特征数据删除;其中,所述第三特征数据用于表征违背常规的数据;针对不满足第一预设条件的第四特征数据,进行离散化处理;其中,所述第四特征数据包括消费涨幅,所述第一预设条件包括消费涨幅不为负值;基于所述第一目标特征数据,确定目标特征数据。4.根据权利要求3所述的方法,其特征在于,所述基于所述第一目标特征数据,确定目标特征数据,包括:基于卡方检测,从所述第一目标特征数据中筛选出预设数量的第二目标特征数据;对所述第二目标特征数据进行频次统计;对频次超过预设频次阈值的所述第二目标特征数据进行对数变换,得到目标特征数据。5.根据权利要求1所述的方法,其特征在于,所述基于各用户的所述特征数据,以及距离哈希函数,得到哈希函数族,包括:将各用户划分为N个子样本;其中,每个子样本中具有M个用户,M和N均为正整数;针对每个子样本,计算每个子样本中M个用户之间的哈希线投影距离;基于所述哈希线投影距离,将所述子样本中的M个用户放入不同的哈希桶中;基于不同的哈希桶,得到哈希函数族。6.根据权利要求5所述的方法,其特征在于,所述计算每个子样本中M个用户之间的哈希线投影距离,包括:2CN115828174A权利要求书2/2页从所述M个用户中选取出两个目标用户;其中,所述目标用户为所述M个用户中的任意两个用户;将所述子样本输入至距离哈希函数中,得到所述子样本中的M个用户中各用户与所述目标用户之间的哈希线投影距离。7.根据权利要求1所述的方法,其特征在于,所述基于所述哈希函数族,构建哈希树,包括:从所述哈希函数族中选取P组哈希桶;针对所述哈希函数族中的每个哈希桶,计算所述哈希桶中各用户对应的哈希线投影距离;将具有相同哈希线投影距离的用户,确定为一个子数据类;遍历每个子数据类,对具有多个用户的子数据类进行哈希计算,直至所述的子数据类满足第二预设条件,生成哈希树;其中,所述第二预设条件包括:所述子数据类中只有一个用户,或所述子数据类对应的哈希树的高度大于或等于