我正在比较不同的聚类方法,我想查看两种不同的方法(或参数集)是否定义了相似的聚类。我的群集被定义为数据框架中的分类因子(分类变量)。针对另一个分类变量绘制分类变量
如果我使用plot()
与X是一个分类变量和ÿ是一个连续变量,我得到一个箱线图。如果我这样做,但和是另一个分类变量,我得到一些奇怪的酒吧阴谋(下图)。你如何解读这位情节之王?
在该图中,X(DF $类别1)有13个级别:
[1] "A" "B" "C" "D" "cluster1" "cluster5" [7] "cluster2" "cluster8" "cluster0" "cluster6" "cluster4" "cluster3" [13] "cluster7"
和ÿ(DF $类别2)只有12个级别:
[1] "A" "B" "C" "D" "cluster5" "cluster0" [7] "cluster4" "cluster2" "cluster3" "cluster6" "cluster1" "cluster7"
A,B,C和D在两列之间是相同的,其余的如果集群不一定与不同集群运行的结果相同。
编辑:使用的代码是plot(df$category1, df$category2)
你用什么样的代码来创建它? – 2012-01-30 11:39:27
'plot(df $ category1,df $ category2)' – pedrosaurio 2012-01-30 11:41:05
还描述了你想让剧情讲述的故事。 – 2012-01-30 11:42:37