预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共19页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113763076A(43)申请公布日2021.12.07(21)申请号202010705904.X(22)申请日2020.07.21(71)申请人北京沃东天骏信息技术有限公司地址100176北京市大兴区经济技术开发区科创十一街18号院2号楼4层A402室(72)发明人李鹏魏圣磊李勇彭长平朱小坤赫阳包勇军颜伟鹏(74)专利代理机构北京英赛嘉华知识产权代理有限责任公司11204代理人王达佐马晓亚(51)Int.Cl.G06Q30/06(2012.01)G06F16/9535(2019.01)G06F16/906(2019.01)权利要求书3页说明书11页附图4页(54)发明名称数据过滤方法和装置(57)摘要本申请公开了数据过滤方法和装置,涉及信息处理技术领域,具体实现方案为:响应于接收到用户第一商品集的过滤请求,获取用户的第一产品对集合和用户行为信息;基于用户复购选取模型和用户行为判定模型,对第一产品对集合进行组合过滤,生成已过滤的第一产品对集合和未过滤的第一产品对集合;根据产品过滤策略,对未过滤的第一产品对集合进行选取,得到第二产品对集合;根据已过滤的第一产品对集合和第二产品对集合,生成用户的第二商品集。该方案充分考虑了用户行为和商品属性,针对用户个性化的复购习惯进行分析,并且对用户行为信息进行判定,使得过滤更加精细和准确,获得了更好的用户体验效果。CN113763076ACN113763076A权利要求书1/3页1.一种数据过滤方法,所述方法包括:响应于接收到用户第一商品集的过滤请求,获取所述用户的第一产品对集合和所述用户行为信息,其中,所述产品对包括:产品名称和与所述产品名称对应的购买时刻;基于用户复购选取模型和用户行为判定模型,对所述第一产品对集合进行组合过滤,生成已过滤的第一产品对集合和未过滤的第一产品对集合,其中,所述用户复购选取模型用于表征基于用户的复购周期和所述购买时刻对所述第一产品对集合进行选取,所述用户行为判定模型用于表征基于所述用户行为信息对所述第一产品对集合进行判定;根据产品过滤策略,对所述未过滤的第一产品对集合进行选取,得到第二产品对集合;根据所述已过滤的第一产品对集合和所述第二产品对集合,生成所述用户的第二商品集。2.根据权利要求1所述方法,其中,所述基于用户复购选取模型,对所述第一产品对集合进行过滤,包括:对所述第一产品对集合中的所有产品对进行聚类后,计算得到所述第一产品对集合中各个产品的复购周期;根据各个产品的复购周期和相应产品的所述购买时刻,判断所述第一产品对集合中各个产品是否超过复购时限;若所述第一产品对集合中的产品超过复购时限,将该产品的产品对存入已过滤的第一产品对集合,若所述第一产品对集合中的产品未超过复购时限,将该产品的产品对存入未过滤的第一产品对集合。3.根据权利要求1所述方法,其中,所述基于用户行为判定模型,对所述第一产品对集合进行过滤,包括:根据所述用户行为的发生时刻和/或所述用户行为的发生次数,判断所述第一产品对集合中的各个产品是否满足豁免条件,其中,所述豁免条件用于表征对所述用户行为的发生时刻和/或所述用户行为的发生次数进行阈值判定,所述判断基于产品的标准产品单位SPU来完成;若所述第一产品对集合中的产品满足豁免条件,将该产品对应的产品对存入已过滤的第一产品对集合,若所述第一产品对集合中的产品不满足豁免条件,将该产品对应的产品对存入未过滤的第一产品对集合。4.根据权利要求2所述方法,其中,在所述对所述第一产品对集合中的所有产品对进行聚类后,计算得到所述第一产品对集合中各个产品的复购周期之后,还包括:从第一所述产品对集合中获取第三产品对集合,其中,所述第三产品对集合用于表征未获得所述复购周期的各个产品对的集合;基于所述产品复购选取模型,对所述第三产品对集合进行过滤,生成与所述第三产品对集合中各个产品的复购周期,其中,所述产品复购选取模型用于表征基于产品的复购周期对所述第三产品对集合进行选取。5.根据权利要求1所述方法,其中,所述产品过滤策略基于多个维度对所述未过滤的第一产品对集合进行组合筛选;所述根据产品过滤策略,对所述未过滤的第一产品对集合进行选取,得到第二产品对集合,包括:根据产品过滤模型,判断所述未过滤的第一产品对集合中的各个产品是否为所述用户2CN113763076A权利要求书2/3页的购买商品,其中,所述产品过滤模型用于表征基于产品的产品词、产品的标准产品单位SPU和产品的库存保有单位SKU中的至少两项,对所述未过滤的第一产品对集合中的各个产品进行组合过滤;若所述未过滤的第一产品对集合中的产品是所述用户的购买商品,则将该产品对应的产品对从所述未过滤的第一产品对集合中删除,得到第二产品对集合。6