如果我的问题是正确的,您希望看到变量中的值的频率,该变量是Clade
列中的值以及单元中此类变量的每个值。
我会做重复的例子,所以你可以调整到您的特定需求:
library(dplyr)
set.seed(1)
values <- c('one', 'two', 'three', 'four', 'five')
df <- data.frame(clade =sample(values, size = 1000, replace = TRUE),
total = rnorm(1000, mean = 0, sd = 1))
# find create a column with the frequency values for each clade variable value
df <- df %>%
group_by(clade) %>%
mutate(freq = n()/nrow(.))
# plot the frequencies
barplot(prop.table(table(df$clade)))
这段代码做的是首先要复制你指的是数据,第二我创建了一个变量在您的数据框中称为freq
,它显示了数据中Clade
变量值的相对频率。最后,我绘制了Clade
变量值的相对频率。
欢迎来到StackOverflow!请阅读关于[如何提出一个好问题](http://stackoverflow.com/help/how-to-ask)以及如何给出[可重现的示例]的信息(http://stackoverflow.com/questions/ 5963269 /如何对化妆一个伟大-R-重复性,例如/ 5963610)。这会让其他人更容易帮助你。 – Jaap
对于灵感,请参阅:[*是否有一个聚合FUN选项来计算事件?*](http://stackoverflow.com/questions/9809166/is-there-an-aggregate-fun-option-to-count-occurrences ) – Jaap