预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共20页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN114266596A(43)申请公布日2022.04.01(21)申请号202111580784.6(22)申请日2021.12.22(71)申请人北京沃东天骏信息技术有限公司地址100176北京市大兴区北京经济技术开发区科创十一街18号院2号楼4层A402室申请人北京京东世纪贸易有限公司(72)发明人刘岩王三鹏林睿(74)专利代理机构北京律智知识产权代理有限公司11438代理人王辉阚梓瑄(51)Int.Cl.G06Q30/02(2012.01)G06Q30/06(2012.01)G06F16/35(2019.01)权利要求书2页说明书12页附图5页(54)发明名称电商舆情数据处理方法、装置、存储介质与电子设备(57)摘要本公开提供一种电商舆情数据处理方法、装置、存储介质与电子设备,涉及数据处理技术领域。其中,所述电商舆情数据处理方法包括:基于预设分类规则,将电商舆情数据进行分类,确定电商舆情数据的数据类别;当电商舆情数据的数据类别为电商活动信息类别时,通过对电商舆情数据进行第一预处理,得到待评估线报数据;当电商舆情数据的数据类别为其他类别时,通过对电商舆情数据进行有效性分析,得到待评估有效数据;通过风险等级评估模型,确定待评估线报数据和/或待评估有效数据的风险等级。本公开通过分类、分析和评估等多级处理,对电商舆情数据的风险性进行更加精细的监控。CN114266596ACN114266596A权利要求书1/2页1.一种电商舆情数据处理方法,其特征在于,包括:基于预设分类规则,将电商舆情数据进行分类,确定所述电商舆情数据的数据类别;当所述电商舆情数据的数据类别为电商活动信息类别时,通过对所述电商舆情数据进行第一预处理,得到待评估线报数据;当所述电商舆情数据的数据类别为其他类别时,通过对所述电商舆情数据进行有效性分析,得到待评估有效数据;通过风险等级评估模型,确定所述待评估线报数据和/或所述待评估有效数据的风险等级。2.根据权利要求1所述的方法,其特征在于,所述当所述电商舆情数据的数据类别为电商活动信息类别时,通过对所述电商舆情数据进行第一预处理,得到待评估线报数据,包括:当所述电商舆情数据的数据类别为电商活动信息类别时,将所述电商舆情数据进行链接解析和关键字替换预处理,得到所述待评估线报数据。3.根据权利要求2所述的方法,其特征在于,在将所述电商舆情数据进行链接解析和关键字替换预处理,得到所述待评估线报数据之前,所述方法还包括:将所述电商舆情数据进行数据格式预处理,得到标准化的电商舆情数据。4.根据权利要求2所述的方法,其特征在于,所述方法还包括:当所述电商舆情数据的链接解析结果满足预设条件时,触发风险数据预警。5.根据权利要求4所述的方法,其特征在于,所述预设条件包括所述链接解析结果所对应的电商活动对象出现频次超过预设阈值。6.根据权利要求1所述的方法,其特征在于,所述风险等级评估模型包含第一词向量层和第一分类层,所述通过风险等级评估模型,确定所述待评估线报数据和/或所述待评估有效数据的风险等级分类结果,包括:分别采用所述第一词向量层中各个词向量化子模型,对所述待评估线报数据和/或所述待评估有效数据进行词向量化处理,得到所述第一词向量层中各个词向量化子模型所对应的待评估词向量数据;分别采用所述第一分类层中各个分类子模型,对所述第一词向量层中各个词向量化子模型所对应的待评估词向量数据进行分类处理,得到所述第一分类层中各个分类子模型所对应的风险等级分类结果;将所述第一分类层中各个分类子模型所对应的风险等级分类结果进行加权,得到所述待评估线报数据和/或所述待评估有效数据的风险等级。7.根据权利要求1所述的方法,其特征在于,所述当所述电商舆情数据的数据类别为其他类别时,通过对所述电商舆情数据进行有效性分析,得到待评估有效数据,包括:当所述电商舆情数据的数据类别为其他类别时,将所述电商舆情数据进行第二预处理,得到第二预处理数据;通过有效性分类模型,将所述第二预处理数据进行有效性分类;当所述第二预处理数据的有效性分类结果为有效时,将所述第二预处理数据作为所述待评估有效数据。8.根据权利要求7所述的方法,其特征在于,所述有效性分类模型包含第二词向量层和2CN114266596A权利要求书2/2页第二分类层,所述通过有效性分类模型,将所述第二预处理数据进行有效性分类,包括:分别采用所述第二词向量层中各个词向量化子模型,对所述第二预处理数据进行词向量化处理,得到所述第二词向量层中各个词向量化子模型所对应的网络词向量数据;分别采用所述第二分类层中各个分类子模型,对所述第二词向量层中各个词向量化子模型所对应的网络词向量数据进行分类处理,得到所述第二分类层中各个分类子模型所