2014-10-28 177 views
-4

我有包含14列预测变量和1列解变量(y)的数据。如何使R中的数据标准化和非标准化?

我想知道是否有任何内置的功能正常化和R.

非规范化的数据,谢谢。

+1

你能否为更广泛的受众多解释一下?并给出一个可重复的例子?你可能会寻找'reshape'函数,或者是Hadley Wickham广泛使用的'reshape2'和/或'tidyr'软件包。 – 2014-10-28 11:54:51

回答

0

包的normDataWithin {Rmisc}可以使用:可用于http://www.inside-r.org/packages/cran/Rmisc/docs/normDataWithin

否则以下方法:

(可变平均值)/ SD。下面的代码可用于data.frame:

mydata$myNormalizedVar<-(mydata$myvar-mean(mydata$myvar))/sd(myvar) 

日志(日志10),LOG2和平方根(SQRT)

普通位数归一化或正常位数变换。试试:

quantNorm = function(x){qnorm(rank(x,ties.method = "average")/(length(x)+1))} 
hist(quantNorm(1:10000),100)