预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共15页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN109903099A(43)申请公布日2019.06.18(21)申请号201910184792.5(22)申请日2019.03.12(71)申请人合肥工业大学地址230009安徽省合肥市包河区屯溪路193号(72)发明人刘业政吴锋田志强李哲杨露贺菲菲(74)专利代理机构北京久诚知识产权代理事务所(特殊普通合伙)11542代理人余罡(51)Int.Cl.G06Q30/02(2012.01)G06Q30/06(2012.01)G06F17/27(2006.01)权利要求书4页说明书9页附图1页(54)发明名称用于评分预测的模型构建方法和系统(57)摘要本发明提供一种用于评分预测的模型构建方法和系统,涉及数据处理技术领域。其包括:S1、定义推荐环境;S2、根据所存在的评论训练LDA主题模型,并计算各个评论在所有主题下的概率分布;S3、构建网络模型;S4、训练更新网络模型中的参数。本发明通过构建神经网络模型,联合利用用户的评论和评分数据进行评分预测,利用主题模型来计算用户评论的主题分布以融合评论文本信息,然后将评分信息与评论信息作为神经网络的两个输出任务,对于评分信息、评论信息这两部分的输出,训练更新网络模型中的参数。本发明构建的用于评分预测的模型综合全面地利用用户对已购买产品的评论和评分,使得本发明构建的模型能更加准确地预测用户对未购买的产品的评分。CN109903099ACN109903099A权利要求书1/4页1.一种用于评分预测的模型构建方法,其特征在于,该方法包括以下步骤:S1、定义推荐环境:包括定义N个用户、M个产品、用户对已购买的产品的评分、评分范围1~R、用户对已购买的产品的评论,N和M均为大于0的自然数;S2、根据所述推荐环境中的所存在的评论训练LDA主题模型,并计算各个评论在所有主题下的概率分布;S3、构建网络模型:对用户和产品进行编码,得到用户的编号和产品的编号;基于用户的编号和产品的编号分别构建两个嵌入层;然后将两个嵌入层合并,得到合并层;利用激活函数对合并层进行多次非线性激活,构建多层非线性层;基于最后一层非线性层添加一个激活函数为softMax的全连接层和一个激活函数为sigmoid的全连接层,激活函数为softMax的全连接层用于表示用户对产品评分,激活函数为sigmoid的全连接层用于表示用户对产品的评论,并计算评分对应类别的概率和评论对应主题类别的概率;S4、训练并更新网络模型中的参数。2.根据权利要求1所述的用于评分预测的模型构建方法,其特征在于,所述方法还包括步骤S5,采用步骤S1~S4构建的用于评分预测的模型,预测用户对未购买的产品会给出的评分。3.根据权利要求1所述的用于评分预测的模型构建方法,其特征在于,所述步骤S1还包括:S101、对评论文本数据预处理,包括:对评论进行分词、去停用词、去噪声词。4.根据权利要求1所述的用于评分预测的模型构建方法,其特征在于,所述步骤S2中计算各个评论在所有主题下的概率分布的具体方法为:对于LDA主题模型,推荐环境中所存在的评论文本构成文档集,分别给文档集到主题以及主题到词的多项式分布添加参数为α和β的dirichlet先验分布,基于LDA主题模型的文档集生成过程,得到整个文档集预料生成的联合概率:其中:w表示文档集中词的集合;z表示文档集中主题的集合;通过GibbsSampling算法对上面的联合分布进行采样,可实现得到给定文档集的主题概率分布:其中:θm,k表示第m篇文档中属于主题k的概率;2CN109903099A权利要求书2/4页表示主题k在第m篇文档中出现的次数;φk,t表示第k个主题中产生词t的概率;表示词t在主题k中出现的次数。5.根据权利要求1所述的用于评分预测的模型构建方法,其特征在于,所述步骤S3中构建用户的嵌入层具体方法为:定义表示模型中的用户u的D维向量以用户的编号作为输入,通过嵌入层映射到较低的维度为D的向量,用eu表示:所述步骤S3中构建产品的嵌入层具体方法为:定义表示模型中的产品i的D维向量以产品的编号作为输入,通过嵌入层映射到较低的维度为D的向量,用ei表示:6.根据权利要求5所述的用于评分预测的模型构建方法,其特征在于,所述步骤S3中的合并层具体表示为:所述步骤S3中非线性层的输出为:定义hl为第l层非线性层的输出,z作为该部分网络的输入,即:h0=zu,ihl=f(hl-1)其中:f(hl-1)表示通过线性转换然后再经过一种非线性的激活函数的转化;所述步骤S3中计算评分对应类别的概率的具体方法为:将评分属于对应类别的概率定义为其中评分在第r个类别上的概率值为其中:hL为第L个ReLU层的输出;所述步骤S3中计算评论对应主题类别的概率的具体方法为