变异系数？

我有一个数值列表呈指数增长。我被要求从他们那里获得多种变异系数。您可能会同意我的观点，即CV仅适用于整个数字集合，并将该组数字划分为子组，并且为每个子组计算CV似乎是不合理的。会不会有多个CV背后的统计思想，如果存在的话，CV是如何生成直方图的，我的意思是历史图的bin是什么。我欣赏提前变异系数？

来源

2017-05-09 State of the art

我同意你的答案 - 它没有任何意义，我计算出多个CV为一个数据集除非有一些推论的理由这样做。

这就是说，实际上可能有考虑数据集的子组的原因。在统计领域，上下文就是一切。我的第一个想法是问你的同事他们为什么希望你这样做。也许有一个很好的理由，也许他们没有像你一样掌握统计数据，无论如何，它应该是一个有启发性的对话。

如果你决定走这条路，这里的一些R代码里面，这可能有助于（R是伟大的 - 灵活，功能强大，而且免费）

# first, simulating some fake data (100 values of measurement & group for 10 groups) 
x <- rnorm(100, mean=10, sd=1) 
group <- sample(LETTERS[1:10], 100, replace=T) 

# first few values of each 
head(data.frame(x, group)) 
      x group 
1 10.778480  F 
2 9.274193  B 
3 9.639143  G 
4 9.080369  I 
5 10.727895  D 
6 10.850306  G 

# this is the part you'd actually need... 
# calculating the sd & avgs for each group 
sds <- tapply(x, group, sd) 
avgs <- tapply(x, group, mean) 

# then the cv 
cvs <- sds/avgs 

cvs 
     A   B   C   D   E   F   G   H   I   J 
0.07859528 0.07570556 0.09370247 0.12552468 0.08897856 0.11044543 0.10947615 0.10323379 0.08908262 0.09729945 

# and if you want a histogram, R makes it pretty easy 
hist(cvs)

来源

2017-05-09 20:17:34

回答

相关问题