2013-03-05 94 views
1

我想将两个循环转换为一个应用函数,其中一个用于循环,希望这会加快我的计算速度。我知道使用apply并不能保证更快的计算,但我想试试看(也适合学习经验来熟悉apply)R:尝试使用apply来转换for循环

我想要做的是;

计算两个矩阵的每一行的皮尔森相关系数,也得到p值。

矩阵双方都有约3000 X 100

现在我的代码看起来是这样的,它已经运行了天维...

cnt <- 1; 
res_row1 <- c(); 
res_row2 <- c(); 
res_corr <- c(); 
res_pval <- c(); 
for (i in (1:dim(m1)[1])) { 
    for (j in (1:dim(m2)[1])) { 
    c <- cor.test(as.matrix(m1[i,]), as.matrix(m2[j,])); 

    res_row1[cnt] <- rownames(m1)[i]; 
# need both row names in the output files 
    res_row2[cnt] <- rownames(m2)[j]; 

    res_corr[cnt] <- c$estimate; 
    res_pval[cnt] <- c$p.value; 
# Storing the results for output 

cnt<-cnt+1; 


    } 
    comp <- (i/dim(m1[1]) * 100; 
    cat(sprintf("Row number of file 1 = %f | %f percent complete \n", i, comp)) 

} 
results <- cbind(res_row1, res_row2, res_corr, res_pval) 

你们能帮助我吗?

+1

你的问题是不是(真的)'for'环vs'apply',而是你在[hell]的第二个圈子里(http://www.burns-stat.com/pages/Tutor/R_inferno.pdf)。 – joran 2013-03-05 15:52:13

+0

谢谢!刚刚在几周前开始使用R。一个不错的开眼界:) – 2013-03-05 18:51:09

回答

1

看一看的cor该手册:

如果 “X”和“y”是矩阵,则协方差(或关联)的“X”的列和列之间 ' y'被计算。

所以,我想尝试:

cor(t(m1), t(m2)) 

对于p值,尽量使用双apply功能:

R > x <- matrix(rnorm(12), 4, 3) 
R > y <- matrix(rnorm(12), 4, 3) 
R > cor(t(x), t(y)) 
     [,1] [,2] [,3]  [,4] 
[1,] 0.9364 0.8474 -0.7131 0.67342 
[2,] -0.9539 -0.9946 0.9936 -0.07541 
[3,] 0.8013 0.9046 -0.9752 -0.25822 
[4,] 0.3767 0.5541 -0.7205 -0.72040 
R > t(apply(x, 1, function(a) apply(y, 1, function(b) cor(b, a)))) 
     [,1] [,2] [,3]  [,4] 
[1,] 0.9364 0.8474 -0.7131 0.67342 
[2,] -0.9539 -0.9946 0.9936 -0.07541 
[3,] 0.8013 0.9046 -0.9752 -0.25822 
[4,] 0.3767 0.5541 -0.7205 -0.72040 
R > t(apply(x, 1, function(a) apply(y, 1, function(b) cor.test(b, a)$p.value))) 
     [,1] [,2] [,3] [,4] 
[1,] 0.2283 0.35628 0.49461 0.5297 
[2,] 0.1940 0.06602 0.07231 0.9519 
[3,] 0.4083 0.28034 0.14201 0.8337 
[4,] 0.7541 0.62615 0.48782 0.4879 
R > cor.test(x[1,], y[1,])$p.value 
[1] 0.2283 
R > cor.test(x[1,], y[2,])$p.value 
[1] 0.3563 
+0

非常感谢你!我的愚蠢的循环可以简化成一条线,令我感到惊讶... – 2013-03-05 18:48:19

+0

哦,还有一件事。如果矩阵具有不同的维度(它们具有相同的列数但不同的行数),我可以做些什么,我想这会导致双重应用函数中的错误。 – 2013-03-05 18:58:42

+0

@JinhyunJu我刚试过。这里似乎没有问题。你能更新你在你的问题中尝试过的吗? – liuminzhao 2013-03-05 19:02:12