预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共12页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN115018545A(43)申请公布日2022.09.06(21)申请号202210635111.4(22)申请日2022.06.07(71)申请人青岛文达通科技股份有限公司地址266500山东省青岛市黄岛区望江路500号(72)发明人管洪清徐亮王伟张元杰张大千尹广楹孙浩云(74)专利代理机构济南圣达知识产权代理有限公司37221专利代理师于凤洋(51)Int.Cl.G06Q30/02(2012.01)G06K9/62(2022.01)权利要求书2页说明书8页附图1页(54)发明名称基于用户画像与聚类算法的相似用户分析方法及系统(57)摘要本发明提出了一种基于用户画像与聚类算法的相似用户分析方法及系统,将用户画像相似度较高的用户聚类为多个簇,降低相似用户检索过程所产生的时间复杂度,由RV‑UP‑MSC方法,按照用户画像被归类为多个簇,并且每个簇的中心点将簇内所有用户的画像特征整合,以虚拟用户的形式进行表示,目标用户在检索过程中,仅需对每个簇所对应的中心点进行用户画像相似度比对,判断出与自己的兴趣爱好可能相似的簇。CN115018545ACN115018545A权利要求书1/2页1.一种基于用户画像与聚类算法的相似用户分析方法,其特征在于,包括如下步骤:1)采集用户对于商品的历史行为信息数据;所述历史行为信息数据包括用户‑商品评分矩阵、商品信息、用户浏览商品记录以及商品的访问频率;2)基于用户历史行为信息数据对用户画像相似度的度量函数进行构建;3)基于用户画像相似度的度量函数对用户画像进行聚类操作,将用户的历史行为信息数据划分为多个聚类簇,将每个簇内具备所有用户画像特征的虚拟用户作为每个聚类簇的中心点;4)保存生成的聚类簇以及聚类中心点,当目标用户进行相似用户的检索时,先进行用户画像相似度的比对,再找出最为相似的虚拟用户以及对应的簇;5)寻找与虚拟用户最为相似的前n个用户,作为目标用户的候选近邻用户。2.如权利要求1所述的基于用户画像与聚类算法的相似用户分析方法,其特征在于,在步骤1)中,所述的商品信息包含商品本身的基本信息,即名称、性质以及商品所属的喜好标签信息,所述商品所属的喜好标签信息为商品所属类型以及是否优惠。3.如权利要求1所述的基于用户画像与聚类算法的相似用户分析方法,其特征在于,根据所述用户浏览商品记录统计用户的喜好标签特征,所述喜好标签特征以多维向量的形式进行表示,每一维的值代表当前维度所对应的喜好标签的访问频率次数;或根据所述用户‑商品评分矩阵获取用户对当前维度所对应商品的评分。4.如权利要求3所述基于用户画像与聚类算法的相似用户分析方法,其特征在于,获取用户当前维度对应商品的评分的方式为:利用用户‑商品评分矩阵,将用户对应的行数据进行提取,则获得当前用户对所有商品的评分信息,并以向量的形式进行表示,所述向量为评分向量,且每一维的值代表用户对当前维度所对应商品的评分。5.如权利要求1所述基于用户画像与聚类算法的相似用户分析方法,其特征在于,所述用户画像相似度的度量函数由协同相似度、轨迹相似度以及喜好标签特征相似度三部分组成,所述协同相似度以Pearson相关系数进行计算,所述轨迹相似度以Jaccard相似度公式进行计算,所述轨迹相似度将作为置信因子对协同相似度加以修正。6.如权利要求5所述基于用户画像与聚类算法的相似用户分析方法,其特征在于,所述喜好标签特征相似度所衡量的是两个特征向量之间的相似度,采用余弦相似度函数进行计算,并构建用户画像相似度的度量函数为:其中ui表示第i个用户,si表示用户i的评分向量,h表示用户i的历史轨迹,而vi表示用户i的喜好特征向量。7.如权利要求1所述基于用户画像与聚类算法的相似用户分析方法,其特征在于,所述基于用户画像相似度的度量函数对用户画像进行聚类的方式为:以用户画像度量函数为基准,利用基于半径变化与用户画像的均值偏移聚类方法对用户画像进行准确聚类,聚类过程如下:步骤1:在未被分类的用户数据点中随机选择一个点作为聚类中心点;2CN115018545A权利要求书2/2页步骤2:找出距离聚类中心点小于R的所有用户数据点,这些数据点组成集合G(u),并将这些点加入聚类中心点所代表的簇,其中数据点之间的距离取两点之间用户画像相似度的倒数;步骤3:计算集合G(u)中每个用户的均值,将聚类中心点偏移至所得均值的位置;步骤4:重复步骤2、3,直到没有新的数据点加入至簇中,并将此时的聚类中心点与最终所形成的簇记录下来;步骤5:重复步骤1、2、3、4直到所有的点都被归类。8.如权利要求7所述的基于用户画像与聚类算法的相似用户分析方法,其特征在于,所述基于半径变化与用户画像的均值偏移聚类方法将用户数据按照用户画像相似度归类为多个簇