预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共16页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

模 式 识 别 结 业 论 文 (采用聚类分析的方法对两种葡萄进行分类) 采用聚类分析的方法对两种葡萄进行分类 摘要 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级,建立聚类分析模型。首先因为样品酒的60个指标之间具有较强的相关性,所以对变量指标进行R型聚类分析,降低变量个数;然后采用Q型聚类分析对样本进行分类。把两组样品葡萄分为5类。红葡萄分类结果:第一类:样品8(反式白藜芦醇苷指标为5.283,而其他样品都小于1);第二类:样品3(氨基酸指标为8397.28远大于该指标均值2385.31)第三类:样品10(VC含量10.25,远大于均值0.477);第四类:样品1、2、4、5、6、7、9、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27;第五类:酒样品11(花色苷指标为104.92,远大于均值7.787); 关键词:R型聚类Q型聚类 1问题分析 要根据酿酒葡萄和葡萄酒的质量的这两种葡萄进行分级,首先对原始酿酒葡萄的理化指标数据进行整理,并把葡萄酒的平均质量指标作为葡萄的变量指标进行考虑。由于白葡萄和红葡萄的分析方法相同,所以我们以红葡萄为例来进行分析。 首先定性考察反映红葡萄指标状况的60个方面,可以看出某些指标之间可能存在较强的相关性。比如氨基酸的总量与天门冬氨酸、苏氨酸、丝氨酸、谷氨酸、脯氨酸、甘氨酸、丙氨酸、胱氨酸、缬氨酸、蛋氨酸、异亮氨酸、酪氨酸、苯丙氨酸、赖氨酸、组氨酸、精氨酸之间可能存在较强的相关性,白藜芦醇与反式白藜芦醇苷、顺势白藜芦醇苷、反式白藜芦醇、顺势白藜芦醇之间可能存在较强的相关性,还原糖与果糖和葡萄糖之间存在较强的相关性,为了验证这种想法,运用MATLAB软件计算60个指标的相关系数矩阵. 其次由相关性矩阵可以判断某些指标之间确实存在很强的相关性,因此可以考虑从这些指标中选取几个有代表性的指标进行聚类分析。为此,把60个指标根据其相关性进行R型聚类,聚成20类,再从每个类中选取代表性的指标。首先对每个变量的数据分别进行标准化处理。变量间相近性度量采用相关系数,类间相近性度量的计算选用类平均法,编写MATLAB程序,从而求出聚类树形图。 最后根据这20个变量指标对27中红葡萄进行聚类分析。首先对每个变量的数据分别进行标准化处理,样本间相似性采用欧氏距离度量,类间距离的计算选用类平均法,编写MATLAB程序,从而得到葡萄聚类树形图。 2模型的建立与求解 根据求得的相关系数矩阵,采用R型分析和Q型分析的方法对葡萄进行分类,具体的数学模型如下: (1)首先对葡萄的指标进行标准化处理,然后通过下面的模型可以求出葡萄变量指标的相关系数矩阵; (2)然后采用最短距离法求出相关系数矩阵中两个类中最近两点间的距离,再采用dendrogram函数,即可画出葡萄变量指标的聚类树形图; 最后对每个变量指标的数据分别进行标准化处理,样本间间的相似性采用欧氏距离度量,类间距离的计算选用类平均法,然后再次使用dendrogram函数求出葡萄的聚类树状图,从而得到葡萄的分类结果。 3模型的结果与分析 1)红葡萄分类的结果与分析如下: (1)对红葡萄变量的聚类树状图: 图1对红葡萄变量的聚类树状图 由图形和MATLAB程序可知,把葡萄的变量指标分为20类,其中还原糖,果糖,葡萄糖,可溶性物质,PH值、可滴定酸,顾酸比,干物质含量,果穗质量,百粒质量,果梗比,出汁率,果皮质量,L*,果皮颜色a+,果皮颜色b*,H,C,18个变量指标之间有较大的相关性,被聚到一起;氨基酸,脯氨酸,花色苷3个变量指标之间存在有较大的相关性,被聚到一起;丝氨酸,缬氨酸,异亮氨酸,亮氨酸,赖氨酸,组氨酸,精氨酸之间存在较大的相关性,被聚成一类;白藜芦醇和顺势白藜芦醇苷之间存在较大的相关性,被聚成一类;黄酮醇。槲皮素,异鼠李素,总糖之间存在较大的相关性,被聚成一类;苏氨酸,谷氨酸,丙氨酸,苹果酸,柠檬酸,多酚氧化酶,褐变度,DPPH自由基,总酚,单宁,葡萄总黄酮之间存在较大的相关性,被聚成一类;其余各自成一类。这样就从60个指标中选定20个分析指标,可以根据这35个指标对27种红葡萄进行聚类分析。 (2)27种红葡萄聚成5类的树状图 图227种红葡萄聚成5类的树状图 由图可知,各种红葡萄之间存在较大的差异,可把27种葡萄分为4类,结果为: 第一类:红葡萄样品8;第二类:红葡萄样品3;第三类:红葡萄样品10;第四类:红葡萄样品1,2,4,5,6,7,9,12,13,14,15,16,17,18,19,20,21,22,23,24,25,26,27;第五类:红葡萄酒样品11. 从以上结果结合聚类图中的合并距离可以看出,红葡萄样品8与其他样品有非常大的不同