预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共29页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

会计学1投影寻踪方法的基本原理与建模型步骤1投影寻踪方法的基本原理与建模步骤2基于加速遗传算法的投影寻踪聚类模型AGA-PPCE2基于加速遗传算法的投影寻踪聚类模型AGA-PPCE2基于加速遗传算法的投影寻踪聚类模型AGA-PPCE加速遗传算法(AGA) 步骤1:模型参数的编码。设码长为e,第j个参数的变化区间为[aj,bj],j=1~p。把这些区间等分成2e-1个子区间: cj=aj+Ijdj(2) 式中子区间长度dj=(bj-aj)/(2e-1)是常数;搜索步数Ij为小于2e的十进制整数,是变数;j=1~p(下同)。把Ij转化成e位二进制数{ia(j,k)|,k=1~e}(下同),即式(3): 步骤2:初始父代群体的随机生成。 生成n组各p个均匀随机数(简称随机数){u(j,i)|,i=1~n},经下式转换成十进制整数。 Ij(i)=INT[u(j,i)2e](4) 式中INT为取整函数。由式(3)得对应二进制数ia(j,k,i),它们与n组模型参数cj(i)对应,并把它们作为初始父代个体群。 编码与解码的逻辑过程:cj(i)~Ij(i)~ia(j,k,i) 步骤3:父代个体适应能力评价。 把第i组参数代入式(1)得目标函数值fi,fi越小表示模型与观测值拟合得越好,适应能力越强,设第i个个体的适应能力与fi成反比。 构造选择概率序列{pi},把[0,1]区间分成n个子区间:(0,p1),(p1,p2),…,[pn-1,pn],它们与n个个体一一对应,fi越小的个体对应的子区间长度越大。 步骤4:父代个体的概率选择。 生成n个随机数{ui|i=1~n},若 ui∈[pi-1,pi], 则选取第i个父代个体,其二进制数记为ia1(j,k,i)。同理可得另外的n个父代个体ia2(j,k,i)。选择是遗传算法的关键,它体现了优胜劣汰的思想。 步骤5:父代个体的杂交。 由步4得到的父代个体配对成n对双亲。生成两随机数u1和u2,再转成十进制整数:IU1=INT(1+u1·e),IU2=INT(1+u2·e),设IU1≤IU2(否则互换其值)。杂交是指第i对双亲ia1(j,k,i)和ia2(j,k,i)随机变换一段二进制数,从而生成第i对子代个体: 01101——00101(5) 10100——11100(6) (杂交前)(杂交后) 步骤6:子代个体的变异。 生成随机数u1,u2,u3和u4。当u1≤0.5时子代个体取式(5),否则取式(6),记其二进制数为ia(j,k,i)。把u2、u3转换为十进制整数: IU1=INT(1+e·u2),IU2=INT(1+e·u3) 设子代变异的概率(称为变异率)为pm。变异是当u4≤pm时对子代个体的IU1位和IU2位的值进行翻转操作: 01101——00111 (变异前)(变异后)步骤7:进化迭代。 第i个子代个体经式(3)、式(2)转化成第i组模型参数。这n个子代个体作为新的父代,算法转入步3,进入下一轮进化过程,重新评价、选择、杂交、变异,如此反复进化,使个体的适应能力不断提高,直到最优个体的优化准则值小于某一指定值或最优个体的优化准则值不再改善,则终止进化迭代,算法结束。 (a)初始分布(b)第20次进化迭代后的分布 (c)第60次进化迭代后的分布步骤8:加速循环。 用第一次、第二次进化迭代所产生的优秀个体的变量变化区间作为变量新的初始变化区间,算法进入步骤1,重新运行SGA算法,如此加速循环,优秀个体的变化区间将逐步调整和收缩,与最优点的距离将越来越近,直到最优个体的优化准则函数值小于某一设定值或算法运行达到预定加速(循环)次数,结束整个算法的运行。此时,就把当前群体中最佳个体或优秀个体的平均值指定为AGA的结果。[AGA的主要特点] 利用标准遗传算法演化过程中的优秀个体子群体来逐步调整、压缩算法的搜索空间。 控制参数设置:二进制编码长度e、杂交概率和变异率分别固定设置为10、1.0和1.0;群体规模n与优秀个体数目s关系:s/n>n/(e·2e),(n,s)的常用配置有(300,10)、(400,20)和(500,30);每次加速循环中AGA只进行两次SGA的进化迭代。 p个变量、加速循环q次,优秀个体包围最优点的概率为(1-0.52s)pq步骤4:建立聚类模型。把由步骤3求得的最佳投影方向a*代入式(2.2)后,得各样本点的投影值z*(i)。投影值z*(i)与z*(j)越接近,表示样本i与样本j越倾向于分为同一类。按z*(i)值从大到小排序,据此可把各指标的样本集进行分类。2基于加速遗传算法的投影寻踪聚类模型AGA-PPCE图2.1气候样本投影值z*(i)的散布图 由表2.1和图2.1可知:①该样本集按投影值z*(i)从大到小排序的样本序号依