2012-10-10 39 views
2

我是学习R的新手。我想知道如何将分类值分配给我作为数据框读取的观察值。例如,我有来自n个样本的m个变量的数据,我想将一些样本分配为组1,将一些样本分配为组2,依此类推。另外,当我绘制它们时,如何可视化不同颜色的不同组别?对R中的样本进行分类,并用不同的颜色绘制它们

+0

欢迎来到R和SO。为了帮助你得到很好的答案,请尝试发布一个[可重现的例子](http://stackoverflow.com/q/5963269)。另外,您的问题包含两个问题,其中只有一个问题在问题标题中提及。 – BenBarnes

+0

这很大程度上取决于你想如何对观测结果进行分类以及观测结果是离散的(在这种情况下它们已经是分类的)或者是连续的(在这种情况下,你将必须决定你想用什么标准对它们进行分类)通过)。 –

回答

5

比方说,你有以下数据:

spam = data.frame(value = runif(100)) 

您可以指定任意小组成员如下:

spam[["group"]] = sample(c("group1", "group2"), nrow(spam), replace = TRUE) 

> head(spam) 
     value group 
1 0.1385715 group1 
2 0.1785452 group1 
3 0.7407510 group2 
4 0.5867080 group1 
5 0.1514461 group1 
6 0.3009905 group1 

绘图用不同颜色的组就可以轻松使用ggplot2来完成:

require(ggplot2) 
ggplot(aes(x = 1:nrow(spam), y = value, color = group), data = spam) + 
    geom_point() 

enter image description here

+0

如果我知道我的数据点属于哪个组,并且我想将特定的组标识分配给所有数据点并对它们进行不同的颜色,该怎么办? –

+0

只需使用正确的名称创建'spam [[“group”]]'列。 –

相关问题