预览加载中,请您耐心等待几秒...
1/3
2/3
3/3

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

一个用R语言进行聚类分析的例子 2013年4月21日 ByHYPERLINK"http://tezhengku.com/topic/?author=1"\o"由student发布"student 在网上(http://www.rdatamining.com/)找到了一个用R语言进行聚类分析的例子,在整个例子中做了一些中文解释说明.数据集用的是iris 第一步:对数据集进行初步统计分析#检查数据的维度>dim(iris)[1]1505 #显示数据集中的列名>names(iris)[1]“Sepal.Length”“Sepal.Width”“Petal.Length”“Petal.Width”“Species” #显示数据集的内部结构>str(iris)‘data.frame’:150obs.of5variables:$Sepal.Length:num5.14.94.74.655.44.654.44.9…$Sepal.Width:num3.533.23.13.63.93.43.42.93.1…$Petal.Length:num1.41.41.31.51.41.71.41.51.41.5…$Petal.Width:num0.20.20.20.20.20.40.30.20.20.1…$Species:Factorw/3levels“setosa”,”versicolor”,..:1111111111… #显示数据集的属性>attributes(iris)$names–就是数据集的列名[1]“Sepal.Length”“Sepal.Width”“Petal.Length”“Petal.Width”“Species” $row.names–个人理解就是每行数据的标号[1]1234567891011121314151617181920[21]2122232425262728293031323334353637383940[41]4142434445464748495051525354555657585960[61]6162636465666768697071727374757677787980[81]81828384858687888990919293949596979899100[101]101102103104105106107108109110111112113114115116117118119120[121]121122123124125126127128129130131132133134135136137138139140[141]141142143144145146147148149150 $class–表示类别[1]“data.frame” 查看数据集的前五项数据情况>iris[1:5,]Sepal.LengthSepal.WidthPetal.LengthPetal.WidthSpecies15.13.51.40.2setosa24.93.01.40.2setosa34.73.21.30.2setosa44.63.11.50.2setosa55.03.61.40.2setosa 查看数据集中属性Sepal.Length前10行数据>iris[1:10,"Sepal.Length"][1]5.14.94.74.65.05.44.65.04.44.9 同上>iris$Sepal.Length[1:10][1]5.14.94.74.65.05.44.65.04.44.9 #显示数据集中每个变量的分布情况>summary(iris)Sepal.LengthSepal.WidthPetal.LengthPetal.WidthSpeciesMin.:4.300Min.:2.000Min.:1.000Min.:0.100setosa:501stQu.:5.1001stQu.:2.8001stQu.:1.6001stQu.:0.300versicolor:50Median:5.800Median:3.000Median:4.350Median:1.300virginica:50Mean:5.843Mean:3.057Mean:3.758Mean:1.1993rdQu.:6.4003rdQu.:3.3003rdQu.:5.1003rdQu.:1.800Max.:7.900Max.:4.400Max.:6.900Max.:2.500 3显示iris数据集列Species中各个值出现频次>table(iris$Species) setosaversicolorvirginica505050 根据列Species画出饼图>pie(table(iris$Species)) 算出列Sepal.Length的所有值的方差>var(iris$Se