预览加载中,请您耐心等待几秒...
1/7
2/7
3/7
4/7
5/7
6/7
7/7

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN109615432A(43)申请公布日2019.04.12(21)申请号201811529567.2G06K9/62(2006.01)(22)申请日2018.12.14(71)申请人成都德迈安科技有限公司地址610000四川省成都市中国(四川)自由贸易试验区成都高新区天府大道北段1480号1号楼B座3层25号(72)发明人张永生(74)专利代理机构成都立新致创知识产权代理事务所(特殊普通合伙)51277代理人谭德兵(51)Int.Cl.G06Q30/02(2012.01)G06F16/9535(2019.01)G06F16/951(2019.01)权利要求书1页说明书4页附图1页(54)发明名称基于大数据的消费者行为画像工具(57)摘要本发明涉及基于大数据的消费者行为画像工具,包括数据提取模块:利用网络爬虫爬取各电商平台用户的消费行为、爬取用户数据、爬取用户ID数据;特征提取模块:采取贝叶斯模型从网络爬虫爬取到的数据提取出需要的特征向量;数据建模模块:以提取的用户特征向量利用分类算法、聚类算法、线性回归算法进行相应的建模,得到该用户的特征标签;数据库:用于存储用户的特征标签;标签分析建模模块:提取一段时间内用户的所有特征标签,并以此进行建模分析得出用户的身份画像。本方案利用网络大数据并结合用户的消费习惯,对用户的身份进行分析,从而得出用户的合理画像,以便于广告的定向推送。CN109615432ACN109615432A权利要求书1/1页1.基于大数据的消费者行为画像工具,其特征在于,包括:数据提取模块:利用网络爬虫爬取各电商平台用户的消费行为、爬取用户数据、爬取用户ID数据;特征提取模块:采取贝叶斯模型从网络爬虫爬取到的数据提取出需要的特征向量;数据建模模块:以提取的用户特征向量利用分类算法、聚类算法、线性回归算法进行相应的建模,得到该用户的特征标签;数据库:用于存储用户的特征标签;标签分析建模模块:提取一段时间内用户的所有特征标签,并以此进行建模分析得出用户的身份画像。2.根据权利要求1所述的基于大数据的消费者行为画像工具,其特征在于,所述网络爬虫还用于从互联网爬取与消费者ID相同的网络数据。3.根据权利要求2所述的基于大数据的消费者行为画像工具,其特征在于,所述网络数据包括该ID网页浏览记录、网页搜索记录。4.根据权利要求3所述的基于大数据的消费者行为画像工具,其特征在于,所述数据提取模块实时爬取用户数据,使得用户特征向量实时更新,从而使得用户的特征标签也实时更新,连续一段时间内的用户多个特征标签同时存储。5.根据权利要求4所述的基于大数据的消费者行为画像工具,其特征在于,所述消费行为包括用户购买商品的种类、购买商品的价格以及购买商品的时间;所述用户数据包括用户账号名称、用户身份证名称、用户年龄。6.根据权利要求5所述的基于大数据的消费者行为画像工具,其特征在于,所述特征向量包括用户账号名称变化向量、商品价格向量、商品种类向量、年龄向量、地址向量;同时包括分析相同ID网页浏览记录、网页搜索记录与用户是否匹配,若匹配则选择为有效特征向量,不匹配则剔除。7.根据权利要求6所述的基于大数据的消费者行为画像工具,其特征在于,所述相同ID网页浏览记录、网页搜索记录与用户是否匹配的具体方法为:根据用户购买一段时间类购房商品的消费类型、用户的性别、ID网页浏览记录、网页搜索记录进行聚类运算,若计算结果符合聚类原则,则表示该ID网页浏览记录、网页搜索记录与用户是相匹配的。8.根据权利要求7所述的基于大数据的消费者行为画像工具,其特征在于,所述数据建模包括:根据账号名称变化向量建立用户性别标签;根据商品价格向量、商品种类向量建立用户消费水平标签;根据商品价格向量、商品种类向量、年龄向量、地址向量、ID网页浏览记录、网页搜索记录建立用户身份标签。9.根据权利要求8所述的基于大数据的消费者行为画像工具,其特征在于,所述用户身份标签一旦建立后,标签分析建模模块还根据更新后的特征标签实时更新修正。2CN109615432A说明书1/4页基于大数据的消费者行为画像工具技术领域[0001]本发明涉及大数据分析领域,具体涉及一种基于大数据的消费者行为画像工具。背景技术[0002]用户画像是一种勾画目标用户、联系用户诉求与设计方向的有效工具。用户画像是一种能将定性与定量方法很好结合在一起的载体,通过定量化的前期调研能获得一个对于用户群较为精准的认识,在后期的用户角色的建立中能很好地对用户优先顺序进行排序,将核心的、规模较大的用户着重突出出来。目前企业的用户画像,是以简单的数据统计和简单的算法模型作为支持,基于Hadoop平台或者其他大数据平台进行离线和部分实时数据处理,以满足报表