预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共16页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN114626899A(43)申请公布日2022.06.14(21)申请号202210516746.2(22)申请日2022.05.13(71)申请人南京铋悠数据技术有限公司地址210000江苏省南京市鼓楼区热河南路37号圈云慧谷高创数据中心2层217室(72)发明人沈荣明马祥(74)专利代理机构北京专赢专利代理有限公司11797专利代理师刘备(51)Int.Cl.G06Q30/02(2012.01)G06Q30/06(2012.01)G06F16/955(2019.01)权利要求书2页说明书8页附图5页(54)发明名称基于大数据的产品销售数据采集方法和系统(57)摘要本发明适用于数据采集技术领域,提供了一种基于大数据的产品销售数据采集方法和系统,所述方法包括以下步骤:接收产品关键词,检索得到对应的产品链接;接收采集数量值,根据采集数量值保留排列靠前的产品链接;采集保留的产品链接所对应产品的月销量、月评论信息、月评论数量和店铺评分,所述月评论数量由月好评数量和月中差评数量组成;确定存在刷单行为的产品链接,并将确定的产品链接删除;根据店铺评分、月销量、月好评数量和月中差评数量对剩余的产品链接进行排列,并显示每条产品链接对应的销售数据。本发明能够将存在刷单行为的产品链接删除,避免对消费者造成误导,使得数据采集更加准确。CN114626899ACN114626899A权利要求书1/2页1.一种基于大数据的产品销售数据采集方法,其特征在于,所述方法包括以下步骤:接收产品关键词,检索得到对应的产品链接;接收采集数量值,根据采集数量值保留排列靠前的产品链接;采集保留的产品链接所对应产品的月销量、月评论信息、月评论数量和店铺评分,所述月评论数量由月好评数量和月中差评数量组成;确定存在刷单行为的产品链接,并将确定的产品链接删除;根据店铺评分、月销量、月好评数量和月中差评数量对剩余的产品链接进行排列,并显示每条产品链接对应的销售数据。2.根据权利要求1所述一种基于大数据的产品销售数据采集方法,其特征在于,所述确定存在刷单行为的产品链接的步骤,具体包括:根据产品链接中的月销量和月评论数量确定总评论占比值,所述总评论占比值=月评论数量总和/月销量总和;计算每个产品链接的单独评论占比值,单独评论占比值=月评论数量/月销量;将单独评论占比值与总评论占比值进行对比确定存在刷单行为的产品链接。3.根据权利要求2所述一种基于大数据的产品销售数据采集方法,其特征在于,所述将单独评论占比值与总评论占比值进行对比确定存在刷单行为的产品链接的步骤,具体包括:设定评论占比上限值和评论占比下限值,评论占比上限值=总评论占比值*(1+a),评论占比下限值=总评论占比值*(1‑b),a和b均为定值;判定单独评论占比值是否属于[评论占比上限值,评论占比下限值],当不属于时,确定单独评论占比值所对应的产品链接存在刷单行为。4.根据权利要求2所述一种基于大数据的产品销售数据采集方法,其特征在于,所述确定存在刷单行为的产品链接,并将确定的产品链接删除的步骤,还包括:对剩余的每个产品链接的月评论信息进行自动识别分析;当月评论信息中存在一个评论内容出现的次数到达数量设定值时,将所述月评论信息对应的产品链接删除。5.根据权利要求1所述一种基于大数据的产品销售数据采集方法,其特征在于,所述根据店铺评分、月销量、月好评数量和月中差评数量对剩余的产品链接进行排列,并显示每条产品链接对应的销售数据的步骤,具体包括:计算产品总评分,产品总评分=店铺评分*c+月销量*d+月好评数量*e‑月中差评数量*f,其中,c、d、e和f均为定值;根据产品总评分对产品链接进行排列;显示每条产品链接对应的销售数据,所述销售数据包括店铺评分、月销量、月好评数量、月中差评数量和热卖款式图片。6.根据权利要求5所述一种基于大数据的产品销售数据采集方法,其特征在于,所述显示每条产品链接对应的销售数据的步骤,具体包括;采集产品链接中每条评论信息对应的用户的购买款式,确定热卖购买款式;获取热卖购买款式所对应的热卖款式图片;显示每条产品链接对应的店铺评分、月销量、月好评数量、月中差评数量和热卖款式图2CN114626899A权利要求书2/2页片。7.一种基于大数据的产品销售数据采集系统,其特征在于,所述系统包括:产品关键词接收模块,用于接收产品关键词,检索得到对应的产品链接;产品链接初步确定模块,用于接收采集数量值,根据采集数量值保留排列靠前的产品链接;原始销售数据采集模块,用于采集保留的产品链接所对应产品的月销量、月评论信息、月评论数量和店铺评分,所述月评论数量由月好评数量和月中差评数量组成;刷单链接删除模块,用于确定存在刷单行为的产品链接,并将确定的产品链接删除;