这是问题的扩展,我在这里问: Getting Factor Means into the dataset after calculation规模 - 复位值误差
现在,我基本上已经标准化的一切,我很感兴趣,使用 我的统计资料想要搜索与这些相交的人的数据集。因此,我正在寻找这样的数据集:
base3[((base3$ScaledAVG>2)&(base3$ScaledOBP>2)&(base3$ScaledK.AB<.20)),]
寻找有三个的那些东西真的球员,但是当我运行这个它重置缩放K.AB值要么3.5,1或2然后不使用该参数进行搜索。以这种方式搜索数据集有没有问题,或者是否有更好的方法来以同样的方式在数据集中查找人员?
下面是一些示例数据,但它并没有同样的问题,当我走出去到4000条记录,我有:
AVG = c(.350,.400,.320,.220,.100,.250,.400,.450)
Conf = c("SEC","ACC","SEC","B12","P12","ACC","B12","P12")
OBP = c(.360,.420,.360,.260,.160,.260,.460,.410)
K.AB = c(.11,.10,.09,.25,.20,.19,.05,.09)
Conf=as.factor(Conf)
d<- data.frame(Conf, AVG,OBP,K.AB)
dd <- do.call(rbind, by(d, d$Conf, FUN=function(x) { x$Scaled <- scale(x$AVG); x}))
dd <- do.call(rbind, by(d, d$Conf, FUN=function(x) { x$Scaled <- scale(x$OBP); x}))
dd <- do.call(rbind, by(d, d$Conf, FUN=function(x) { x$Scaled <- scale(x$K.AB); x}))
dd[((dd$ScaledAVG>2)&(dd$ScaledOBP>2)&(dd$ScaledK.AB<.20)),]
谢谢!
您提供的示例数据几乎没用 - 什么是base3?你有'confName'和'Conf',并且没有'Scaled'任何东西。请重现这一点。 – 2013-03-24 00:14:53
最终的函数不会对这些数据做任何事情,但假设你是否有一堆,并且值高于平均值2 sds,这是达到它们的最佳方式还是有更好的方法来做到这一点? – BaseballR 2013-03-24 00:39:45
而且我重写了样本数据,我很抱歉没有让它重现!除了最后一部分之外,这应该都是有效的。 – BaseballR 2013-03-24 00:40:43