预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共12页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN111612573A(43)申请公布日2020.09.01(21)申请号202010370275.X(22)申请日2020.04.30(71)申请人杭州电子科技大学地址310018浙江省杭州市下沙高教园区2号大街(72)发明人颜成钢熊昕殷建孙垚棋张继勇张勇东(74)专利代理机构杭州君度专利代理事务所(特殊普通合伙)33240代理人朱月芬(51)Int.Cl.G06Q30/06(2012.01)G06N7/00(2006.01)权利要求书3页说明书6页附图2页(54)发明名称一种基于全贝叶斯方法的推荐系统评分推荐预测方法(57)摘要本发明公开了一种基于全贝叶斯方法的推荐系统评分推荐预测方法法。本发明步骤:步骤1.根据用户过去的购买信息建立用户物品评分矩阵R0;步骤2.根据物品属性信息建立物品词向量矩阵X0;步骤3.利用深度学习方法来提取物品词向量矩阵X0的特征信息,通过成批降噪变分自动编码机模型来提取这种特征信息;成批降噪变分自动编码机模型是整体构架模型的一部分,整体构架模型则为协同成批降噪变分自动编码机。本发明改善了分层贝叶斯结构,使得具有不确定性的推断有了一定的弹性空间,推荐准确度有所上升。同时利用全贝叶斯结构有效提取了物品隐因子向量,一定程度上解决了数据稀疏性带来的推荐效率下降问题。CN111612573ACN111612573A权利要求书1/3页1.一种基于全贝叶斯方法的推荐系统评分推荐预测方法,其特征在于具体包括如下步骤:步骤1.根据用户过去的购买信息建立用户物品评分矩阵R0,矩阵为I*J维,I为参与测评的用户总数,J为参与测评的物品总数,用户i如果曾经购买了物品j,则用户i对物品j的评分矩阵元素R0ij为1,否则为0;步骤2.根据物品属性信息建立物品词向量矩阵X0,矩阵为J*Voc维,J为参与测评的物品总数,而Voc为描述物品的属性信息的词典库的大小,每个物品都由一系列在词典库中的词描述而成,通过独热编码的方式,以0/1的方式表示是否利用x词来形容j物品;步骤3.利用深度学习方法来提取物品词向量矩阵X0的特征信息,通过成批降噪变分自动编码机模型来提取这种特征信息;成批降噪变分自动编码机模型是整体构架模型的一部分,整体构架模型则为协同成批降噪变分自动编码机。2.根据权利要求1所述的一种基于全贝叶斯方法的推荐系统评分推荐预测方法,其特征在于步骤3具体实现如下:3-1.对输入的物品词向量矩阵X0添加噪声,来增加鲁棒性;3-2.构建协同成批降噪变分自动编码机的网络结构;3-3.训练协同成批降噪变分自动编码机,确定训练损失函数。3.根据权利要求2所述的一种基于全贝叶斯方法的推荐系统评分推荐预测方法,其特征在于步骤3-1具体添加噪声实现如下:Xc=Xo*Mask(1)其中,Xc为添加噪声后的物品词向量矩阵;X0为原始的物品词向量矩阵,[Mask]J*Voc为加噪矩阵,[Mask]J*Voc与X0具有相同的维度,同时[Mask]J*Voc元素满足二项分布。4.根据权利要求2或3所述的一种基于全贝叶斯方法的推荐系统评分推荐预测方法,其特征在于步骤3-2具体如下:物品属性信息编码部分的网络结构为一个自动编码机,将输入的物品属性向量经过多个全连接层降维,得到降维后的物品特征向量;将得到的物品特征向量利用贝叶斯的方法进行编码,编码的结果即为需要的物品属性向量压缩编码结果,该压缩编码结果服从根据输入经过多个全连接层提取出来的特征向量的贝叶斯参数形成的正态分布;所述的贝叶斯参数包括均值以及方差;接着利用相反维度的多个全连接层进行解码还原输入的物品属性向量。5.根据权利要求4所述的一种基于全贝叶斯方法的推荐系统评分推荐预测方法,其特征在于所述的物品词向量矩中的每一行是物品属性向量。6.根据权利要求4所述的一种基于全贝叶斯方法的推荐系统评分推荐预测方法,其特征在于所述的协同成批降噪变分自动编码机利用服从规则的正态分布来进行初始化,这种构架下的模型是一种全贝叶斯方法的模型;初始化的公式如下所示:2CN111612573A权利要求书2/3页Wl,*n为第l层权重矩阵Wl的第n列,bl为第l层的偏执矩阵,τj为求物品特征向量的偏置量,ui为用户隐因子向量;其中λw,λn,λu为超参数;所述的用于降维和升维的全连接层的计算过程:Xl,j*=σ(Xl-1,j*Wl+bl)Xl,*j为第l层全连接层第j行的输出结果,其中σ表示激活函数;所述的服从正态分布的贝叶斯参数的计算过程:-6δ=10+log(1+eXafter)-1,其中代表均值,而δ代表标准差,假定模型的总层数为L,则XL/2为自动编码机最中间层的压缩特征矩阵,lens为压缩特征矩阵XL/2的列数目,而被记为before_