预览加载中,请您耐心等待几秒...
1/7
2/7
3/7
4/7
5/7
6/7
7/7

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN107992558A(43)申请公布日2018.05.04(21)申请号201711221757.3(22)申请日2017.11.28(71)申请人国网四川省电力公司信息通信公司地址610000四川省成都市武侯区人民南路四段63号三、四层(72)发明人刘捷潘可佳杨懿杨开琼张程(74)专利代理机构成都行之专利代理事务所(普通合伙)51220代理人梁田(51)Int.Cl.G06F17/30(2006.01)G06N3/08(2006.01)G06Q30/02(2012.01)G06Q50/06(2012.01)权利要求书2页说明书4页(54)发明名称一种基于遗传算法改进的K-means算法的用电用户聚类方法(57)摘要本发明公开了一种基于遗传算法改进的K-means算法的用电用户聚类方法,包括:对数据进行预处理并生成初始群体;计算数据的差异度,并随机选取k个点作为聚类中心并聚类;计算每个聚类的差异度;分别取每个聚类中心的坐标,聚类点平均值坐标点的个数作为特征,对K个聚类结果特征进行交叉变异,得到的新的子代作为候选的聚类结果的指标;计算聚类结果的适应度;由聚类适应度计算每个个体被选择的概率pi,筛选这一轮被选择的个体Xi并生成队列Yi;对队列Yi进行交叉运算形成新的群体X,若迭代次数满足300次则终止进化过程。本方法通过遗传算法改进始质点的分布位置来优化K-means的最终聚类结果,通过多次进化修改初始的聚类中心点,使用电用户聚类结果更为可靠。CN107992558ACN107992558A权利要求书1/2页1.一种基于遗传算法改进的K-means算法的用电用户聚类方法,其特征在于,包括以下步骤,A、对数据进行预处理并生成初始群体;B、计算数据的差异度作为初始种群的特征,并随机选取k个点作为聚类中心,根据聚类中心对数据进行聚类;C计算每个聚类的差异度;D、分别取每个聚类中心的坐标,聚类点平均值坐标,点的个数作为特征,对k个聚类结果特征进行交叉变异,得到的新的子代作为候选的聚类结果的指标;E、计算聚类结果的适应度;F、由聚类适应度计算每个个体被选择的概率pi,筛选这一轮被选择的个体Xi并生成队列Yi;G、对队列Yi进行交叉运算形成新的群体X,若迭代次数满足300次则终止进化过程;H、重复步骤C~F。2.根据权利要求1所述的一种基于遗传算法改进的K-means算法的用电用户聚类方法,其特征在于,所述数据预处理包括清理数据集中错误、数据格式不完整的数据。3.根据权利要求2所述的一种基于遗传算法改进的K-means算法的用电用户聚类方法,其特征在于,所述清理的方法具体为:删除集中错误数据、采用插值法补齐格式不完整数据。4.根据权利要求1所述的一种基于遗传算法改进的K-means算法的用电用户聚类方法,其特征在于,所述生成初始群体的方法为:对每个个体的染色体进行编码,编码为{X11、X21、…Xm1、X12、X22…Xm2、…X1k、X2k…Xmk},其中,K为聚类中心的个数,m为每个个体的染色体的维度;每条染色体随机从数据集中抽取一个m维的数据;生成初始群体X。5.根据权利要求4所述的一种基于遗传算法改进的K-eans算法的用电用户聚类方法,其特征在于,初始群体X随机生成,随机范围为中心坐标的区间。6.根据权利要求1所述的一种基于遗传算法改进的K-means算法的用电用户聚类方法,其特征在于,所述差异度的计算方法为:判断数据样本类型,若数据都是数值型,则利用欧式距离计算;若数据是混合型,则使用采用下列公式计算:其中,t为总的可数值化的参数个数,m为第m个数值参数d(xi,m,xj,m)为点xi,m与xj,m的欧式距离,θm为第m个比例系数,i表示行数,j表示与i不同的行数。7.根据权利要求1所述的一种基于遗传算法改进的K-means算法的用电用户聚类方法,其特征在于,所述步骤E具体为:由聚类结果K个类别计算机,工作日需要的劳动量、休息日的劳动量、工作日、休息日的劳动单价以及客户等待时间计算K个类别的价值量V作为该聚类结果的适应度。2CN107992558A权利要求书2/2页8.根据权利要求1所述的一种基于遗传算法改进的K-means算法的用电用户聚类方法,其特征在于,所述步骤F具体为:根据适应度函数计算每个个体的适应度ai以得到每个个体适应度的总合A;计算每个个体被选择的概率pi;随机产生一个0到1之间的数r,当个体Xi对应的概率pi大于r时,则Xi列入交叉运算的队列Yi。9.根据权利要求1所述的一种基于遗传算法改进的K-means算法的用电用户聚类方法,其特征在于,交叉运算时,交叉率为适应度pi的立方根Pc,变异率为适应度pi的立方Pm。3CN10799255