我想按自己的方式对分类变量进行排序。我已将我的数据集分组为“1-5”,“6-10”,“11-20”....“> 251”等类别。如果绘制变量或在表格中显示它们的图例序列,则标签中的序列会“混乱”。我以自己的方式在R中排序变量
这并不奇怪,因为R不知道这些无序变量实际上是有序的。有没有办法给他们附加一个手动定义的序列?
thx任何建议提前!
我想按自己的方式对分类变量进行排序。我已将我的数据集分组为“1-5”,“6-10”,“11-20”....“> 251”等类别。如果绘制变量或在表格中显示它们的图例序列,则标签中的序列会“混乱”。我以自己的方式在R中排序变量
这并不奇怪,因为R不知道这些无序变量实际上是有序的。有没有办法给他们附加一个手动定义的序列?
thx任何建议提前!
分类变量在绘制时存储为(或转换为)factor
。它们在图中出现的顺序取决于因子的级别。您可能想使用cut
创建您的群组。例如
dfr <- data.frame(x = runif(100, 1, 256))
dfr$groups <- cut(dfr$x, seq(1, 256, 5))
这个问题也很类似于another recent SO question。
事实上,这个建议似乎只是rcs告诉你你以前的问题http://stackoverflow.com/questions/3288361/create-size-categories-without-nested-ifelse-in-r – 2010-07-20 12:26:06
是的,你'再右吧。显然我需要仔细看看这个剪切函数。刚刚使用ifelse到目前为止...... thx指出它。此外,我仍然有兴趣重新安排订单,一旦我设置错误的方式... – 2010-07-20 12:58:47
cut()将允许您设置订单。如果您需要进一步控制,factor()允许您设置顺序。 – John 2010-07-20 13:47:32
当我想设定一个系数不同的顺序手动(乏味,但有时是必要的),这里是我做的:
> ## a factor
> x <- factor(letters[1:3])
> ## write out levels with dput
> dput(levels(x))
c("a", "b", "c")
> ## copy, paste, modify and use factor again. e.g.
> x <- factor(x, levels=c("b", "a", "c"))
> x
[1] a b c
Levels: b a c
有趣的使用'dput'。 – 2010-07-23 16:18:26
我喜欢用split
对于诸如此类的事情。
VECT = runif(10)
vect.categories = C(REP(LETTERS [1],5),代表(LETTERS [2],3),代表(LETTERS [5],2 ))
category.list =拆分(VECT,vect.categories)
....
可能不相关,但认为我会提供建议。
请您提供一些示例代码(最小的,可重现的),以便我们可以确切地看到您正在尝试做什么。 – 2010-07-20 12:20:16
我同意,你的问题的答案已经提供,当你的措辞稍早不同。答案仍然相同,cut()。 – John 2010-07-20 13:45:58
我不认为cut()是更一般的重排序因素问题的答案。下面我的2c。 – 2010-07-20 18:13:40