预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共11页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN112819570A(43)申请公布日2021.05.18(21)申请号202110082078.2(22)申请日2021.01.21(71)申请人东北大学地址110819辽宁省沈阳市和平区文化路3号巷11号(72)发明人王莲莲任涛王心悦汤怀智(74)专利代理机构沈阳东大知识产权代理有限公司21109代理人李在川(51)Int.Cl.G06Q30/06(2012.01)G06F16/9536(2019.01)G06F40/284(2020.01)权利要求书3页说明书5页附图2页(54)发明名称一种基于机器学习的商品智能搭配推荐方法(57)摘要本发明公开一种基于机器学习的商品智能搭配推荐方法,该方法通过对商品属性信息(包括类目和分词)、用户购买历史和商品图像数据集进行分析和建模,为商品推荐可搭配的商品集。其中,借助基于内容的推荐算法,利用商品分词属性进行商品相似度计算;借助基于商品的协同过滤算法进行相似度计算;针对图像数据,利用聚类算法对图像进行聚类,然后计算图像像素相似度;构造了不同的候选集,再对不同的候选集进行加权平均。本发明将文本数据和图像数据进行综合使用,使最终的搭配推荐结果可以实现高效有效识别。CN112819570ACN112819570A权利要求书1/3页1.一种基于机器学习的商品智能搭配推荐方法,其特征在于,包括如下步骤:步骤1:对于给定的待搭配推荐商品,根据商品分词,借助基于内容的推荐算法计算商品间的相似度,将相似度值Term_similarity(x,y)排名前M的商品作为候选集1;步骤2:根据用户购买历史,采用基于内容的协同过滤搭配算法,以Jaccard系数为基础进行建模,计算商品对x和y的协同过滤相似度cf_sim(x,y);步骤3:利用降低活跃用户在相似性中的贡献度,对购买商品x和商品y的用户的交集做改进来改进Jaccard系数,改进后的协同过滤相似度记为cf_sim1(x,y);步骤4:对同一用户购买的商品对间隔时间差作出惩罚,对购买商品x和商品y的用户的交集做改进来改进Jaccard系数,改进后的协同过滤相似度记为cf_sim2(x,y);步骤5:对于指定商品求搭配集,利用步骤2至步骤4计算的协同过滤相似度cf_sim(x,y),cf_sim1(x,y)和cf_sim2(x,y),分别过滤掉同类目商品之后筛选出与其相似度排名前M的商品,作为候选集2、候选集3、候选集4;步骤6:对于给定的待搭配推荐商品,从K‑Means聚类结果的聚类簇中选择该商品所在簇的所有商品,剔除掉同类目商品;步骤7:利用步骤6中的得到的结果进行补充,利用两张图像的像素方差对比求图像相似度diff_sim(x,y),选取排名前M的商品作为候选集5;步骤8:对候选集1、候选集2、候选集3、候选集4和候选集5中的相似度进行加权平均,然后选取排名前M的商品推荐给用户。2.根据权利要求步骤1所述的基于机器学习的商品智能搭配推荐方法,其特征在于:所述步骤1的过程如下:步骤1.1:根据商品分词计算每个商品分词的tf值和idf值;其中,tf指的是该分词在这个商品分词中出现的频率,tf越高表示分词对这个商品越重要;idf指的是逆向文件频率,由总商品数量除以包含这个分词的商品数量进行数值决定,idf越低说明分词对商品越重要,计算过程如下:idf(xk)=log2(count/countk)其中,xk是商品x的第k个分词,countx是商品x的分词个数,count是总商品个数,是商品x的xk的个数,countk是包含分词xk的商品数量;步骤1.2:计算每个商品分词的重要性,也即Tf‑idf值,如下:g1(xj)=tf(xk)*idf(xk)其中,g1是商品的tf‑idf值;步骤1.3:利用余弦相似度计算商品相似性,计算公式如下:其中,x和y是两件商品,g1(xj)为商品x的第j个分词的重要性,g1(xk)为商品y的第k个分词的重要性;步骤1.4:商品筛选:对于指定商品求搭配集,过滤掉同类目商品之后筛选出与其相相似度排名前M的商品,作为候选集1。2CN112819570A权利要求书2/3页3.根据权利要求2所述的基于机器学习的商品智能搭配推荐方法,其特征在于:所述商品分词的重要性保存为字典的形式,在python中将其保存为.npy文件的形式,而非.txt文件或者.csv文件,便于更加高效地调用,如下所示:{商品1:{分词1:tf‑idf1,分词2:tf‑idf2,…},…}计算相似度时,直接从字典里提取相应数据,借助公式计算即可。4.根据权利要求1所述的基于机器学习的商品智能搭配推荐方法,其特征在于,所述商品之间的协同过滤相似度的计算公式如下:其中,Union(x,y)表示