2012-01-30 138 views
3

我正在比较不同的聚类方法,我想查看两种不同的方法(或参数集)是否定义了相似的聚类。我的群集被定义为数据框架中的分类因子(分类变量)。针对另一个分类变量绘制分类变量

如果我使用plot()X是一个分类变量和ÿ是一个连续变量,我得到一个箱线图。如果我这样做,但是另一个分类变量,我得到一些奇怪的酒吧阴谋(下图)。你如何解读这位情节之王?

plot you get when plotting a categorical variable against another categorical variable

在该图中,X(DF $类别1)有13个级别:

[1] "A" "B" "C" "D" "cluster1" "cluster5" [7] "cluster2" "cluster8" "cluster0" "cluster6" "cluster4" "cluster3" [13] "cluster7"

ÿ(DF $类别2)只有12个级别:

[1] "A" "B" "C" "D" "cluster5" "cluster0" [7] "cluster4" "cluster2" "cluster3" "cluster6" "cluster1" "cluster7"

A,B,C和D在两列之间是相同的,其余的如果集群不一定与不同集群运行的结果相同。

编辑:使用的代码是plot(df$category1, df$category2)

+0

你用什么样的代码来创建它? – 2012-01-30 11:39:27

+0

'plot(df $ category1,df $ category2)' – pedrosaurio 2012-01-30 11:41:05

+0

还描述了你想让剧情讲述的故事。 – 2012-01-30 11:42:37

回答

4

xy是两个因素,plot电话spineplot。来自该功能帮助页面的示例:

treatment <- factor(rep(c(1, 2), c(43, 41)), levels = c(1, 2), 
    labels = c("placebo", "treated")) 
improved <- factor(rep(c(1, 2, 3, 1, 2, 3), c(29, 7, 7, 13, 7, 21)), 
    levels = c(1, 2, 3), 
    labels = c("none", "some", "marked")) 

spineplot(improved, treatment) 

虽然这看起来有点不同于您有的情节。

+1

'spineplot'这就是我想知道的。我想他们看起来并不应该这样,因为A,B,C和D的等级在这两个因素中是相同的。 – pedrosaurio 2012-01-30 12:06:31

+1

谢谢。这完全是谷歌证明!你不可能知道一个x,y的图,它们都是分类变量,在R中被表示为* spineplot *。 (除非您反向搜索每个基本绘图功能的每一页) – smci 2013-07-11 06:04:31

3

不是你问的,而是尝试镶嵌图()。它会产生一个适用于两个分类变量的图形。