预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共18页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN114741603A(43)申请公布日2022.07.12(21)申请号202210437699.2(22)申请日2022.04.25(71)申请人大连理工大学地址116024辽宁省大连市甘井子区凌工路2号(72)发明人周宽久高崧豪李浚瑀刘楠(74)专利代理机构辽宁鸿文知识产权代理有限公司21102专利代理师许明章王海波(51)Int.Cl.G06F16/9535(2019.01)G06F16/9536(2019.01)G06F16/2455(2019.01)G06K9/62(2022.01)G06Q30/06(2012.01)权利要求书4页说明书11页附图2页(54)发明名称基于用户聚类和商品聚类的混合协同过滤推荐算法(57)摘要一种基于用户聚类和商品聚类的混合协同过滤推荐算法,针对互联网电商平台,设计属性偏好矩阵实现系统推荐冷启动;再对聚类结果进行降噪处理,并引入融合因子α,获取Top‑n推荐集。最后,根据购买记录分析商品间的关联规则和用户对商品属性的偏好权值,获得关联规则推荐集与用户个性化推荐集,结合Top‑n推荐集共同得到用户推荐列表,完成对多维度精准推荐。本发明能够在冷启动阶段没有实际购买数据的情况下,对用户进行较为精准的推荐;并且在聚类中利用双重聚类算法与聚类降噪处理,使推荐算法较传统推荐算法在推荐精准度方面有较大幅度提升,此外本发明利用关联规则分析,结合ID3进行赋权实现对商品间关联规则和用户个性的推荐,推荐结果更加科学、全面。CN114741603ACN114741603A权利要求书1/4页1.一种基于用户聚类和商品聚类的混合协同过滤推荐算法,其特征在于,包括以下步骤:步骤1、引用外部购买记录获得用户属性对商品属性的评价矩阵;通过对外部购买记录的利用,获得用户属性对商品属性的评价矩阵C,评价矩阵如公式(1)或公式(2)所示:Ue×C×Pe=Ee(1)其中,e下标所示,为外部购买记录内容;Ue表示用户属性矩阵,行为外部数据源用户ID,列为用户属性;C表示用户属性对商品属性的评价矩阵,行为用户属性,列为商品属性;Pe表示商品属性矩阵,行为商品属性,列为外部数据源商品ID;Ee表示,用户商品评价矩阵;表示,Ue矩阵的逆矩阵,表示Pe矩阵的逆矩阵;公式(1)可等同于公式(2);采用如下所示的左逆矩阵(3)与右逆矩阵(4),实现上述公式:HL=(HT×H)‑1×HT(3)HR=HT×(HT×H)‑1(4)其中,H为m行n列矩阵:当m≥n时,H有左逆矩阵HL,计算公式为(3);当m≤n时,H有右逆矩R阵H,计算公式为(4);因此,当Ue行数≥列数时,代入公式(3)求出当Pe行数≤列数时,代入公式(4)求出Ue与Pe的选取显然符合上述条件;由此,通过公式(2)能够获得C矩阵,该矩阵具有普遍性,能够与系统中用户属性矩阵和商品属性矩阵结合完成冷启动;步骤2、将用户属性对商品属性的评价矩阵、系统中用户属性矩阵和商品属性矩阵结合,获得初始用户评价矩阵,选取Top‑n,完成冷启动;具体如下:引入外部购买记录获得用户属性对商品属性的评价矩阵C,解决冷启动阶段无法推荐的问题,将其与系统中已有用户信息及商品信息结合,得到用户评价矩阵,表示为公式(5):Ui×C×Pi=Ei(5)其中,Ui表示本系统用户属性矩阵,行为用户ID,列为用户属性;Pi表示本系统商品属性矩阵,行为商品属性,列为商品ID;Ei表示本系统初始用户商品评价矩阵;对Ei中每个用户对商品的评分进行排序,选取评分最高的n个商品,进行初步推荐;由此,可实现冷启动阶段对用户的Top‑n推荐,完成冷启动;在系统积累一定的用户、商品以及评价数据后,进行后续步骤;步骤3、利用系统中已有的用户属性矩阵和商品属性矩阵,分别对用户与商品进行聚类,确定初始簇心,并进行聚类迭代,直至类簇稳定不变;具体如下:3.1)采用余弦相似定理计算用户之间和商品之间的相似度,3.2)在K‑Means聚类中,利用簇心聚集相似的用户或商品;选取彼此最不相似的k个点作为初始簇心;3.3)类簇是簇心聚集的用户或商品向量的容器,存放相似度高的用户或商品向量;为使聚类结果稳定,计算类簇内所有向量均值作为新簇心,与原簇心作比较,该方法表示为公式(7):2CN114741603A权利要求书2/4页其中,Kold为原簇心,Knew为新簇心,n为类簇B中的向量个数,b为类簇B中的向量;首先,利用公式(7)计算向量与各初始簇心相似度;而后,将向量分配到与其最相似簇心所在的类簇中;最后,计算该类簇中所有向量和的均值作为新簇心Knew:若Knew=Kold,则表明该类簇稳定,否则使Knew替换Kold,重复上述操作,直至所有类簇稳定;步骤4、降噪处理,将靠近多个簇心的向量识别