2010-07-20 57 views
0

我想按自己的方式对分类变量进行排序。我已将我的数据集分组为“1-5”,“6-10”,“11-20”....“> 251”等类别。如果绘制变量或在表格中显示它们的图例序列,则标签中的序列会“混乱”。我以自己的方式在R中排序变量

这并不奇怪,因为R不知道这些无序变量实际上是有序的。有没有办法给他们附加一个手动定义的序列?

thx任何建议提前!

+2

请您提供一些示例代码(最小的,可重现的),以便我们可以确切地看到您正在尝试做什么。 – 2010-07-20 12:20:16

+0

我同意,你的问题的答案已经提供,当你的措辞稍早不同。答案仍然相同,cut()。 – John 2010-07-20 13:45:58

+0

我不认为cut()是更一般的重排序因素问题的答案。下面我的2c。 – 2010-07-20 18:13:40

回答

4

分类变量在绘制时存储为(或转换为)factor。它们在图中出现的顺序取决于因子的级别。您可能想使用cut创建您的群组。例如

dfr <- data.frame(x = runif(100, 1, 256)) 
dfr$groups <- cut(dfr$x, seq(1, 256, 5)) 

这个问题也很类似于another recent SO question

+2

事实上,这个建议似乎只是rcs告诉你你以前的问题http://stackoverflow.com/questions/3288361/create-size-categories-without-nested-ifelse-in-r – 2010-07-20 12:26:06

+0

是的,你'再右吧。显然我需要仔细看看这个剪切函数。刚刚使用ifelse到目前为止...... thx指出它。此外,我仍然有兴趣重新安排订单,一旦我设置错误的方式... – 2010-07-20 12:58:47

+0

cut()将允许您设置订单。如果您需要进一步控制,factor()允许您设置顺序。 – John 2010-07-20 13:47:32

4

当我想设定一个系数不同的顺序手动(乏味,但有时是必要的),这里是我做的:

> ## a factor 
> x <- factor(letters[1:3]) 
> ## write out levels with dput 
> dput(levels(x)) 
c("a", "b", "c") 
> ## copy, paste, modify and use factor again. e.g. 
> x <- factor(x, levels=c("b", "a", "c")) 
> x 
[1] a b c 
Levels: b a c 
+0

有趣的使用'dput'。 – 2010-07-23 16:18:26

-1

我喜欢用split对于诸如此类的事情。

VECT = runif(10)

vect.categories = C(REP(LETTERS [1],5),代表(LETTERS [2],3),代表(LETTERS [5],2 ))

category.list =拆分(VECT,vect.categories)

....

可能不相关,但认为我会提供建议。