预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共18页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN114139650A(43)申请公布日2022.03.04(21)申请号202111502036.6(22)申请日2021.12.09(71)申请人青海大学地址810016青海省西宁市宁大路251号(72)发明人陈来军薛小代马恒瑞陈辰(74)专利代理机构西安铭泽知识产权代理事务所(普通合伙)61223代理人韩晓娟(51)Int.Cl.G06K9/62(2022.01)权利要求书3页说明书9页附图5页(54)发明名称一种用户负荷双层聚类方法(57)摘要本发明涉及负荷数据聚类分析技术领域,公开了一种用户负荷双层聚类方法,使用短时互相关系数聚类算法,对用户负荷进行形态相似聚类,得到多个第一聚类簇;使用欧氏距离聚类算法,对多个第一聚类簇依据幅度进行聚类;采用短时互相关系数对负荷曲线进行形态相似聚类,保留了样本间的不相似程度,避免了互相关系数过度位移致使聚类效果不佳。因为限制了序列的位移区间,相较于DTW和k‑shape两种考虑时序特性的形态聚类算法相比,算法运行时间更短,并且在聚类效果和有效性指标上表现更优,利用基于欧氏距离的聚类算法对形态相似聚类的结果进行二次聚类,将互相关系数和欧氏距离各自的优势相结合,实现了对负荷曲线的精细划分。CN114139650ACN114139650A权利要求书1/3页1.一种用户负荷双层聚类方法,其特征在于,包括以下步骤:S1、使用短时互相关系数聚类算法,对用户负荷进行形态相似聚类,得到多个第一聚类簇;S2、使用欧氏距离聚类算法,对多个第一聚类簇依据幅度进行聚类。2.如权利要求1所述的用户负荷双层聚类方法,其特征在于,所述步骤S1进行形态相似聚类的过程包括:S11、对用户负荷原始数据集进行Z标准化;S12、基于短时互相关系数聚类算法,确定形态最佳聚类数;S13、根据形态最佳聚类数获得对应的多个第一聚类簇。3.如权利要求2所述的用户负荷双层聚类方法,其特征在于,所述步骤S2依据幅度进行聚类的过程包括:S21、根据多个第一聚类簇使用欧氏距离聚类算法,确定幅度最佳聚类数;S22、根据幅度最佳聚类数,输出对应的多个第二聚类簇。4.如权利要求3所述的用户负荷双层聚类方法,其特征在于,短时互相关系数的具体计算过程如下:首先,对用户负荷原始数据集序列和序列进行Z标准化,对序列进行Z标准化如式(1)所示:式(1)中,为标准化后的序列;Z标准化后,每个序列都满足均值为0,标准差为1,消除负荷曲线幅度特征对计算形态相似度的影响;然后,将序列固定,序列在序列的时间轴上滑动,序列的移位表示如式(2)所示:式(2)中,表示序列移位s的所有情况,s∈[‑1,1];当s=0时,表示序列无位移;当s=1时,表示序列在时间轴上向右位移1;当s=‑1时,表示序列在时间轴上向左位移1;由此得到长度为3的短时互相关序列定义如式(3)所示:式(3)中,利用式(4)依次计算:2CN114139650A权利要求书2/3页式(4)中,k=ω‑2;最后,将短时互相关序列系数归一化为如式(5)所示,使其取值范围为[‑1,1],式(5)中,为序列的自相关;依据式(5),计算出使其取最大的ω值,为方便表征距离,推导出DNSCC作为时间序列的形态相似性度量方式,如式(6)所示:式(6)中,的取值范围[0,2],0代表序列和完全相似。5.如权利要求4所述的用户负荷双层聚类方法,其特征在于,所述步骤S12中确定形态最佳聚类数的过程包括:S121、选取初始质心使用轮盘法选取初始质心,设聚类数为k,初始化质心的方法如下:S1211、从n个样本中随机选取一个样本作为第一个质心,记为定义一个长度为n的距离序列D(i)=(d1,d2,...di),并初始化序列中每一个元素为无穷大;S1212、对样本集中的每个样本分别计算与的距离更新距离序列D(i)=(d1,d2,...di),更新规则如下:S1213、选择距离序列D(i)中最大的元素di,其对应的样本作为下一个质心S1214、重复步骤S1212和S1213,直到选出k个质心为止;S122、最佳聚类数的选取因DNSCC不同于欧氏距离,故对聚类评价指标中的SSE进行适当调整,作为外层形态聚类数k的确定依据,如式(8)所示:式(8)中,为类j中的负荷样本;为类j的质心;nj为类j中包含的样本个数,随着聚类数k增加,SSE会逐步下降,当下降趋势突然变缓时,所对应的k值即为最佳聚类数,称为“肘部”;居民用户的负荷曲线特征较复杂,实际应用中可能出现无法在损失函数的图像上找到明显“肘部”的情况,同时参考轮廓系数和损失函数图像共同确定聚类数k,单个样本的轮廓系数定义如式(9)所示:3CN114139650A权利要求书3/3页式(9)中,a(i)为样本i和同类其他