预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共16页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN114463067A(43)申请公布日2022.05.10(21)申请号202210128000.4G06F16/9535(2019.01)(22)申请日2022.02.11(71)申请人深圳市聚商鼎力网络技术有限公司地址518109广东省深圳市龙华区龙华街道清华社区清龙路6号港之龙科技园H栋12层(72)发明人孔明祝彬彬(74)专利代理机构北京冠和权律师事务所11399专利代理师田春龙(51)Int.Cl.G06Q30/02(2012.01)G06Q30/06(2012.01)G06K9/62(2022.01)G06V30/414(2022.01)权利要求书3页说明书9页附图3页(54)发明名称一种基于大数据的用户浏览行为的用户兴趣建模方法(57)摘要本发明提供了一种基于大数据的用户浏览行为的用户兴趣建模方法,包括:获取用户的浏览页内容以及在浏览页下停留的时间长度;确定浏览页上的商品,并按照预设的商品分类规则确定所浏览的商品的所属归类;将同一类商品的浏览页进行归类,统计用户在某类商品对应浏览页下的驻留时间;根据该类商品对应浏览页的文本内容长度以及驻留时间,计算出用户的浏览速度,并建立兴趣度计算模型,从而计算确定用户对该类商品的兴趣度。通过本发明,实现基于用户对商品的浏览速度来确定用户对该类商品的兴趣度。CN114463067ACN114463067A权利要求书1/3页1.一种基于大数据的用户浏览行为的用户兴趣建模方法,其特征在于,包括:获取用户的浏览页内容以及在每个浏览页下停留的时间长度;根据所述浏览页内容确定浏览页上的商品,并按照预设的商品分类规则确定用户所浏览的商品的所属归类;将同一类商品的浏览页进行归类,统计用户在某类商品对应浏览页下的驻留时间;根据该类商品对应浏览页的文本内容长度以及所述驻留时间,计算出用户的浏览速度,并根据所述浏览速度建立兴趣度计算模型。2.根据权利要求1所述的一种基于大数据的用户浏览行为的用户兴趣建模方法,其特征在于,所述根据所述浏览页内容确定浏览页上的商品,并按照预设的商品分类规则确定用户所浏览的商品的所属归类包括:确定所述浏览页上的多个显示区域,并确定每个所述显示区域的显示方式,其中所述显示方式包括文字、图像、视频中的一种或多种结合;基于各个所述显示区域的显示方式,确定各个所述显示区域对应的提取方式;基于各个所述显示区域对应的提取方式对各个显示区域内的文字进行提取,并基于提取的文字生成文本档案;确定所述文本档案中的商品词汇,根据所述商品词汇确定用户所浏览的商品,并按照预设的商品分类规则确定用户所浏览的商品的所属归类。3.根据权利要求2所述的一种基于大数据的用户浏览行为的用户兴趣建模方法,其特征在于,所述基于各个所述显示区域对应的提取方式对各个显示区域内的文字进行提取,并基于提取的文字生成文本档案包括:对文字显示方式的显示区域内的文字进行直接提取,得到第一类文本信息;对图像显示方式的显示区域内的文字通过图像文本识别技术进行提取,得到第二类文本信息;对视频显示方式的显示区域内的文字,先对视频内容进行分帧,对每一帧图像中的文字通过图像文本识别技术进行提取,通过拼接得到第三类文本信息;将所述第一类文本信息、所述第二类文本信息以及所述第三类文本信息,分段拼接生成文本档案。4.根据权利要求3所述的一种基于大数据的用户浏览行为的用户兴趣建模方法,其特征在于,在对每一帧图像中的文字通过图像文本识别技术进行提取,得到每一帧图像对应的文本内容的过程中,若遇到连续两帧图像对应的两个文本内容,需要将重复的文本内容进行删除,根据视频图像帧的前后关系确定文本的上下文关系,将剩余的文本内容拼接得到第三类文本信息。5.根据权利要求2所述的一种基于大数据的用户浏览行为的用户兴趣建模方法,其特征在于,所述确定所述文本档案中的商品词汇,根据所述商品词汇确定用户所浏览的商品,并按照预设的商品分类规则确定用户所浏览的商品的所属归类包括:对所述文本档案进行关键字分析得到多个关键的词汇,确定每一个词汇所出现的频率,并按照出现的频率高低对词汇进行排序;从出现频率最高的词汇开始,将每一个词汇与预设的商品词汇列表内的多个词汇进行一一匹配,从而确定该词汇是否属于所述商品词汇列表;2CN114463067A权利要求书2/3页当确定该词汇属于所述商品词汇列表时,将该词汇放入该页面对应的商品词汇组;当商品词汇组内的词汇数量达到预设数量阈值时,确定商品词汇组内的每一个词汇分别与其他词汇之间的关联度;确定与所述词汇组中其他多个词汇之间的关联度的平均值最高的那个词汇为该浏览页所对应的商品词汇,进而确定用户所浏览的商品;按照预设的商品分类规则确定用户所浏览的商品的所属归类。6.根据权利要求5所述的