针对另一个分类变量绘制分类变量

我正在比较不同的聚类方法，我想查看两种不同的方法（或参数集）是否定义了相似的聚类。我的群集被定义为数据框架中的分类因子（分类变量）。针对另一个分类变量绘制分类变量

如果我使用plot()与X是一个分类变量和ÿ是一个连续变量，我得到一个箱线图。如果我这样做，但和是另一个分类变量，我得到一些奇怪的酒吧阴谋（下图）。你如何解读这位情节之王？

plot you get when plotting a categorical variable against another categorical variable

在该图中，X（DF $类别1）有13个级别：

[1] "A" "B" "C" "D" "cluster1" "cluster5" [7] "cluster2" "cluster8" "cluster0" "cluster6" "cluster4" "cluster3" [13] "cluster7"

和ÿ（DF $类别2）只有12个级别：

[1] "A" "B" "C" "D" "cluster5" "cluster0" [7] "cluster4" "cluster2" "cluster3" "cluster6" "cluster1" "cluster7"

A，B，C和D在两列之间是相同的，其余的如果集群不一定与不同集群运行的结果相同。

编辑：使用的代码是plot(df$category1, df$category2)

来源

2012-01-30 pedrosaurio

你用什么样的代码来创建它？ – 2012-01-30 11:39:27

'plot（df $ category1，df $ category2）' – pedrosaurio 2012-01-30 11:41:05

还描述了你想让剧情讲述的故事。 – 2012-01-30 11:42:37

当x和y是两个因素，plot电话spineplot。来自该功能帮助页面的示例：

treatment <- factor(rep(c(1, 2), c(43, 41)), levels = c(1, 2), 
    labels = c("placebo", "treated")) 
improved <- factor(rep(c(1, 2, 3, 1, 2, 3), c(29, 7, 7, 13, 7, 21)), 
    levels = c(1, 2, 3), 
    labels = c("none", "some", "marked")) 

spineplot(improved, treatment)

虽然这看起来有点不同于您有的情节。

来源

2012-01-30 11:54:08

'spineplot'这就是我想知道的。我想他们看起来并不应该这样，因为A，B，C和D的等级在这两个因素中是相同的。 – pedrosaurio 2012-01-30 12:06:31

谢谢。这完全是谷歌证明！你不可能知道一个x，y的图，它们都是分类变量，在R中被表示为* spineplot *。（除非您反向搜索每个基本绘图功能的每一页） – smci 2013-07-11 06:04:31

不是你问的，而是尝试镶嵌图（）。它会产生一个适用于两个分类变量的图形。

来源

2012-01-30 14:26:37

针对另一个分类变量绘制分类变量

回答

相关问题