2015-04-02 69 views
4

我有一个包含6497实例,12个属性和名为q(质量)的类变量的数据集。类的值的范围可从3到9中的数据可以用CSV格式从here如何在群集中绘制多维数据

我使用K均值对数据分割成3个集群

set.seed(1234) 
nr <- NROW(wine$.row) 
ind <- sample(nr, 0.66 * nr, replace = FALSE) #66% 
w_clus3 <- kmeans(wine[ind, 2:12], 3) 
matrix3 <- table(cl_predict(w_clus3, wine[-ind,2:12 ]),wine$q[-ind]) 

下载有一种方法我可以使用clusplot或任何其他可视化图形来显示数据如何在三个群集之间进行拆分?

我试过,但即时通讯错误。

clusplot(wine[2:12], w_clus3$cluster, color=TRUE, shade=TRUE,labels=2, lines=0) 

如果维数太多...我怎么才能显示出很少的属性以及它们是如何在集群中分割的。

回答

1

降维如PCA怎么样?比你可能有一些可视化的功能集。