预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共13页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN115423644A(43)申请公布日2022.12.02(21)申请号202210711320.2G06K9/62(2022.01)(22)申请日2022.06.22(71)申请人浙江领见数智科技有限公司地址310000浙江省杭州市拱墅区杭州新天地商务中心11幢南楼702室申请人杭州领见数字农业科技有限公司(72)发明人邵向荣周祖煜张浩陈煜人张澎彬林波白博文莫志敏李天齐刘俊(74)专利代理机构杭州快知知识产权代理事务所(特殊普通合伙)33293专利代理师杨冬玲(51)Int.Cl.G06Q50/06(2012.01)G06Q20/06(2012.01)权利要求书2页说明书7页附图3页(54)发明名称一种基于电量数据对虚拟货币挖矿用户识别的方法及系统(57)摘要本发明提供一种基于电量数据对虚拟货币挖矿用户识别的方法及系统,包括:进行数据获取,获取训练组数据和测试组数据;将获取的所述训练组数据和测试组数据进行合并;对合并后的数据中的每张表进行缺失值查看,计算多项指标;将处理后的数据进行切分后,使用随机森林算法进行拟合调参,建立模型并加上自定义规则;使用训练好的随机森林算法模型来进行预测,筛选出疑似用户。本发明解决了现有对挖矿用户难以快速识别的缺陷,实现根据用电量分析准确判定使用矿机挖矿用户。CN115423644ACN115423644A权利要求书1/2页1.一种基于电量数据对虚拟货币挖矿用户识别的方法,其特征在于,包括:进行数据获取,获取训练组数据和测试组数据;将获取的所述训练组数据和测试组数据进行合并;对合并后的数据中的每张表进行缺失值查看,计算多项指标;将处理后的数据进行切分后,使用随机森林算法进行拟合调参,建立模型并加上自定义规则;使用训练好的随机森林算法模型来进行预测,筛选出疑似用户。2.根据权利要求1所述的基于电量数据对虚拟货币挖矿用户识别的方法,其特征在于,所述进行数据获取,获取训练组数据和测试组数据,具体包括:所述训练组数据包括:用户档案明细表、日用电量明细表、月用电量明细表、疑似用户明细表;所述测试组数据包括:用户档案明细表、日用电量明细表、月用电量明细表;练组数据和测试组数据中均包括用户月度用电数据、日用电量数据、日峰电量、日谷电量、日平电量、日期数据、用电类型名称和昨日正向费率1、2、3、4电量。3.根据权利要求1所述的基于电量数据对虚拟货币挖矿用户识别的方法,其特征在于,所述数据合并,将获取的所述训练组数据和测试组数据进行合并,具体包括:首先使用数据分析模块采用归并排序算法,根据用户ID列进行训练组和测试组中各个类型表数据的合并,合并为用户明细表、月用电量明细表、日用电量明细表。4.根据权利要求1所述的基于电量数据对虚拟货币挖矿用户识别的方法,其特征在于,所述数据处理,对合并后的数据中的每张表进行缺失值查看,计算多项指标,具体包括:对用户明细表、月用电量明细表、日用电量明细表中每张表使用isnull.sum()方法进行缺失值查看,发现日用电量表中昨日正向费率存在大量缺失值,理解字段含义缺失值应当为0,故使用0进行填补;月用电量表与用户明细表均不存在缺失数据,计算多项指标值;处理后的数据表中列名分别为用户ID,总计用电量,子电量的变异系数均值,用电类型,昨日正向费率电量,标签值是否为疑似用户。5.根据权利要求4所述的基于电量数据对虚拟货币挖矿用户识别的方法,其特征在于,所述计算多项指标值包括:电量的变异系数均值、月度总用电量、用电类型和昨日正向费率电量;所述电量的变异系数均值计算公式为:变异系数均值=日峰电量、日谷电量以及日平电量的标准差/(日峰电量、日谷电量以及日平电量)+1e‑5;所述月度总用电量的计算公式为:总用电量=根据用户ID对月度用电量求和;所述用电类型进行编码,将原数据用电类型从文本类型编码变为数值数据类型;所述昨日正向费率电量计算公式为:昨日正向费率电量=昨日正向费率1电量+昨日正向费率2电量+昨日正向费率3电量+昨日正向费率4电量。6.根据权利要求1所述的基于电量数据对虚拟货币挖矿用户识别的方法,其特征在于,所述数据建模,将处理后的数据进行切分后,使用随机森林算法进行拟合调参,建立模型并2CN115423644A权利要求书2/2页加上自定义规则,具体包括:根据处理后的数据进行建模,将数据按7:3比例切分,切分后使用随机森林算法进行拟合,拟合后对算法进行调参;建立随机森林算法模型并加上自定义规则。7.一种基于电量数据对虚拟货币挖矿用户识别的系统,其特征在于,所述系统包括:数据获取模块,用于获取训练组数据和测试组数据;数据合并模块,用于将获取的所述训练组数据和测试组数据进行合并;数据处理模块,用于对合并后的数据中的每张表进行缺失值