预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共14页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN114238758A(43)申请公布日2022.03.25(21)申请号202111531109.4G06F40/289(2020.01)(22)申请日2021.12.14G06F16/35(2019.01)G06K9/62(2022.01)(71)申请人杭州电子科技大学G06N3/04(2006.01)地址310018浙江省杭州市下沙高教园区2G06N3/08(2006.01)号大街G06Q30/06(2012.01)申请人浙江盘石信息技术股份有限公司(72)发明人周仁杰郭星宇张纪林万健刘畅赵乃良殷昱煜蒋从锋刘焱李炳陈青雯(74)专利代理机构杭州君度专利代理事务所(特殊普通合伙)33240代理人朱亚冠(51)Int.Cl.G06F16/9535(2019.01)G06F16/36(2019.01)权利要求书3页说明书7页附图3页(54)发明名称一种基于多源跨界数据融合的用户画像预测方法(57)摘要本发明公开一种基于多源跨界数据融合的用户画像预测方法,针对现有技术项目特征稀疏、高阶结构化特征缺失以及用户行为序列特征缺失而导致的用户特征预测不准的问题。基于用户产生的电商数据,利用知识图谱扩充商品特征、利用图卷积网络充分对用户历史购买记录进行挖掘及利用循环神经网络预测用户的潜在购买特征,有效提升了用户画像预测的准确性。本发明的优点在于利用通过知识图谱解决了商品特征稀疏的问题,通过图卷积神经网络解决高阶结构化特征缺失的问题,通过循环神经网络解决了用户行为序列特征缺失的问题,为推荐系统的性能提升打下良好基础。CN114238758ACN114238758A权利要求书1/3页1.一种基于多源跨界数据融合的用户画像预测方法,其特征在于包括以下步骤:步骤1:采集用户在购物平台交互产生的信息,包括用户的基本信息和用户行为记录,构建用户集合,商品名称集合以及商品名称‑用户的交互记录;所述用户的基本信息,包括性别、年龄;所述用户行为记录,包括购买商品的时间、商品编号、商品名称;步骤2:构建异构知识图和用户历史交互序列;2‑1构建异构知识图、用户行为序列集合2‑1‑1将商品名称进行分词,得到分词结果集合{i1,i2,...,im,...},im表示第m个分词;2‑1‑2在公开知识图谱中对分词结果集合进行2轮递归查找,舍弃不存在于公开知识图谱中的分词结果,将分词结果集合中剩余分词和公开知识图谱中查找得到的实体构成实体集合ε={e1,e2,...,en,...},并进一步将其构建成三元组(im,contain,en),contain表示im与en间的关联关系;利用上述三元组(im,contain,en)构建商品名称对应的知识子图2‑1‑3将商品名称对应的知识子图整合成异构知识图2‑2根据用户集合,商品名称集合以及商品名称‑用户的交互记录构建用户‑商品名称交互矩阵N表示用户数,M表示商品名称数;2‑3根据用户‑商品名称交互矩阵进一步构建用户历史交互序列集合:其中表示用户u在第i次历史交互的商品名称,表示用户u与交互发生的时刻;步骤3:根据用户集合、实体集合ε进一步构建用户嵌入矩阵实体嵌入矩阵以及用户邻接矩阵其中D表示向量的维度;所述用户邻接矩阵中各元素表示两用户间的点击行为相似度;步骤4:构建多源跨界数据融合的用户画像预测模型;所述的多源跨界数据融合的用户画像预测模型包括输入嵌入层、异构知识图卷积层、用户行为序列感知层、输出层:4‑1输入嵌入层:使用用户历史交互序列集合构建用户交互实体集合Ne(u);使用用户嵌入矩阵对用户进行向量化表示;使用实体嵌入矩阵对用户交互实体进行向量化表示Si(u);根据用户邻接矩阵获得用户的近邻用户嵌入向量,构建近邻用户集合Su(u);4‑2异构知识图卷积层:用户交互实体的表示向量进入异构知识图卷积层后,将执行两部分操作;4‑2‑1用户交互实体通过H轮迭代聚合近邻拓扑结构特征得到具有近邻特征的用户‑商品名称表示向量4‑2‑2用户u的近邻用户集合表示向量与用户u表示向量进行聚合,得到用户近邻特征表示向量4‑2‑3用户‑商品名称表示向量和用户近邻特征表示向量拼接后与用户u表示向量相加得到异构知识图卷积层的输出向量4‑3所述用户行为序列感知层采用LSTM或GRU对用户序列特征进行建模以提取用户潜在兴趣;以为输入,得到与异构知识图卷积层输出相同维度的向量;4‑4输出层:输出层将异构知识图卷积层和用户行为序列感知层输出的结果相加,然后2CN114238758A权利要求书2/3页转化为与预测特征种类数相同维度的输出向量;步骤5:对于步骤4中得到的用户输出向量o,进行softmax操作,得到预测用户基本信息对应的概率。2.如权利要求1所述的一种基于多源跨界数据融合