预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共25页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN115828134A(43)申请公布日2023.03.21(21)申请号202211346826.4(22)申请日2022.10.31(71)申请人深圳市国电科技通信有限公司地址518109广东省深圳市龙华区大浪街道新石社区华联工业区13栋1层申请人深圳智芯微电子科技有限公司(72)发明人王祥洪海敏占兆武唐远洋蔡义(74)专利代理机构北京清亦华知识产权代理事务所(普通合伙)11201专利代理师季永杰(51)Int.Cl.G06F18/24(2023.01)G06F18/23(2023.01)G06F123/02(2023.01)权利要求书3页说明书14页附图7页(54)发明名称用电数据样本构建、模型训练、账户类别确定方法和装置(57)摘要本发明公开了一种用电数据样本构建、模型训练、账户类别确定方法和装置,所述用电数据样本构建方法包括:获取用电负荷时间序列;利用用电负荷时间序列中预设值的占比以及对应的变异系数生成负荷曲线抖动数据;基于用电负荷时间序列进行相似度计算,确定第一周期特征数据;根据子时间序列之间的相关系数进行平均计算,得到第二周期特征数据;对指定时间段内的用电负荷时间序列、负荷曲线抖动数据、第一周期特征数据、第二周期特征数据进行组合,得到用于训练用电账户分类模型的数据样本。由此通过为基础用电负荷时间序列数据构建与用电负荷规律特点相关的特征数据,可以有效提高用电用户分类的准确率。CN115828134ACN115828134A权利要求书1/3页1.一种用电数据样本构建方法,其特征在于,所述方法包括:获取用电负荷时间序列;其中,所述用电负荷时间序列被切割为若干子时间序列;利用所述用电负荷时间序列中预设值的占比、所述用电负荷时间序列对应的变异系数生成负荷曲线抖动数据;其中,所述变异系数是由所述用电负荷时间序列的均值、标准差决定的;基于所述用电负荷时间序列进行相似度计算,确定第一周期特征数据;根据所述子时间序列之间的相关系数进行平均计算,得到第二周期特征数据;对指定时间段内的用电负荷时间序列、所述负荷曲线抖动数据、所述第一周期特征数据、所述第二周期特征数据进行组合,得到用于训练用电账户分类模型的数据样本。2.根据权利要求1所述的方法,其特征在于,所述第二周期特征数据包括年周期特征数据;所述根据所述子时间序列之间的相关系数进行平均计算,得到第二周期特征数据,包括:确定所述用电负荷时间序列对应的用电趋势时间序列;以年为时间单位对所述用电趋势时间序列进行切割,得到至少两个年用电趋势时间序列;基于任意两个年用电趋势时间序列之间的相关系数进行平均计算,确定所述年周期特征数据。3.根据权利要求2所述的方法,其特征在于,所述确定所述用电负荷时间序列对应的用电趋势时间序列,包括:对指定时间段内的用电负荷时间序列进行平均计算,得到用电均值时间序列;对所述用电均值时间序列时间进行数据平滑过滤,得到所述用电负荷时间序列对应的用电趋势时间序列。4.根据权利要求1所述的方法,其特征在于,所述第二周期特征数据包括日周期特征数据;所述根据所述子时间序列之间的相关系数进行平均计算,得到第二周期特征数据,包括:以天为时间单位对所述用电负荷时间序列进行切割,得到至少两个天用电负荷序列;基于任意两个所述天用电负荷序列之间的相关系数进行平均计算,得到所述日周期特征数据。5.根据权利要求1所述的方法,其特征在于,所述基于所述用电负荷时间序列进行相似度计算,确定第一周期特征数据,包括:按照预设时间单位对所述用电负荷时间序列进行切割,得到至少两个预设时间单位负荷序列;利用汉明距离算法计算任意两个预设时间单位负荷序列之间的相似度;将所述任意两个预设时间单位负荷序列之间的相似度的平均值作为所述第一周期特征数据。6.根据权利要求1至5任一项所述的方法,其特征在于,所述数据样本标注有用电账户类别;其中,所述用电账户类别为水平型类别、零值规律类别、年周期性类别、日周期性类别、随机型类别中的任一个;其中,属于所述水平型类别的用电账户的负荷曲线近似为直线;2CN115828134A权利要求书2/3页属于所述零值规律类别的用电账户的负荷曲线中零值占比超过阈值且非零值具有周期性规律;属于所述年周期性类别的用电账户的用电负荷曲线存在年周期性规律;属于所述日周期性类别的用电账户的用电负荷曲线存在日周期性规律。7.一种模型训练方法,其特征在于,所述方法包括:获取通过权利要求1至6中的任一项方法所构建的数据样本,作为第一用电数据样本;将所述第一用电数据样本输入至用电账户分类模型进行预测,得到用电账户预测类别;根据所述用电账户预测类别、所述数据样本被标注的用电账户类别对所述用电账户分类模型的参数进行更新,直至满足模型停止训练条件。8.一