预览加载中,请您耐心等待几秒...
1/6
2/6
3/6
4/6
5/6
6/6

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN106339421A(43)申请公布日2017.01.18(21)申请号201610670147.0(22)申请日2016.08.15(71)申请人北京集奥聚合科技有限公司地址100085北京市海淀区上地东路1号院5号楼9层901(72)发明人华林森张翼崔晶晶林佳婕(74)专利代理机构北京和信华成知识产权代理事务所(普通合伙)11390代理人胡剑辉(51)Int.Cl.G06F17/30(2006.01)G06Q30/02(2012.01)权利要求书1页说明书3页附图1页(54)发明名称一种用户浏览行为的兴趣挖掘方法(57)摘要公开一种用户浏览行为的兴趣挖掘方法,用户u1,u2,u3,指定时间内用户u1访问了网站标签t1,t2,t3,用户u2访问了网站标签t2,用户t3访问了网站标签t2,t3,该方法包括步骤:(1)对每个兴趣标签内的一些典型网站进行标注,此时这些标注的网站tag->interest对应兴趣的权重默认为1.0;(2)根据用户user及其指定时间内访问过的网站tag之间建立二部图模型,通过n轮随机游走,其中n为正整数,汇总多轮游走的结果,计算出user->tag的权重;(3)用步骤(2)的user->tag乘以步骤(1)的tag->interest,得到user->interest,user->interest是每个用户到所有兴趣标签的一个置信度值;(4)设置一个阈值a,当user->interest的置信度大于a时,作为user预测为interest兴趣标签。CN106339421ACN106339421A权利要求书1/1页1.一种用户浏览行为的兴趣挖掘方法,用户u1,u2,u3,指定时间内用户u1访问了网站标签t1,t2,t3,用户u2访问了网站标签t2,用户t3访问了网站标签t2,t3,其特征在于:该方法包括以下步骤:(1)对每个兴趣标签内的一些典型网站进行标注,此时这些标注的网站tag->interest对应兴趣的权重默认为1.0;(2)根据用户user及其指定时间内访问过的网站tag之间建立二部图模型,通过n轮随机游走,其中n为正整数,user1->tag1->user2->tag2->user3->tag3,汇总多轮游走的结果,计算出user->tag的权重;(3)用步骤(2)得到的user->tag乘以步骤(1)得到的tag->interest,得到user->interest,user->interest是每个用户到所有兴趣标签的一个置信度值,介于0-n之间,n是随机游走迭代的次数;(4)设置一个阈值a,当user->interest的置信度大于a时,作为user预测为interest兴趣标签。2.根据权利要求1所述的用户浏览行为的兴趣挖掘方法,其特征在于:所述步骤(2)包括以下分步骤:(2.1)通过用户user访问网站tag的次数pv和天数dv进行加权求和,然后归一化得到初始的user->tag和tag->user的权重;(2.2)用tag->user的权重乘以user->tag的权重,得到tag->tag的权重;(2.3)设第1轮游走迭代的user->tag的权重为步骤(2.1)中得到的user->tag的值,记为I1,那么设第n轮游走迭代的结果为In,则In+1=In*(tag->tag);(2.4)汇总求和:tag->user=I1+I2+.....In。3.根据权利要求1所述的用户浏览行为的兴趣挖掘方法,其特征在于:所述步骤(2.1)中,用户访问所有网站的pv和dv都是相同的,那么user1->tag1=1/3,user1->tag2=1/3,user1->tag3=1/3,user2、user3的计算与user1的计算相同;tag3->user1=1/2,tag3->user3=1/2,tag1、tag2的计算与tag3的计算相同。4.根据权利要求3所述的用户浏览行为的兴趣挖掘方法,其特征在于:所述步骤(2.2)中计算结果为:tag2->tag1=(tag2->user1)*(user1->tag1)=1/3*1=1/3,tag2->tag3=(tag2->user1)*(user1->tag3)+(tag2->user3)*(user3->tag3)=1/3*1/3+1/3*1/2=5/18,tag1,tag3计算同tag2。5.根据权利要求4所述的用户浏览行为的兴趣挖掘方法,其特征在于:所述步骤(2.3)中第2轮随机游走:user1->tag3=(user1->tag1)*(tag1->tag3)+(user1->tag2)*(tag2->tag3)=1*1/3+1/3*5/18=23/54。2CN106