2016-07-23 92 views
0

我想让我的合并变成parallel而不是在R顺序,我试图使用并行库,但它不工作(我不知道如何使用它,尝试把合并函数放在它里面,但不能和我的输入一起工作)。R - 如何并行化我的mergesort

我输入一个txt文件,每行一个字符串,我必须对它进行排序。

这是我的顺序代码:

#start time 
strt<-Sys.time() 

#merge sort 
mmerge<-function(a,b) { 
r<-numeric(length(a)+length(b)) 
ai<-1; bi<-1; j<-1; 
for(j in 1:length(r)) { 
    if((ai<=length(a) && a[ai]<b[bi]) || bi>length(b)) { 
    r[j] <- a[ai] 
    ai <- ai+1 
    } else { 
    r[j] <- b[bi] 
    bi <- bi+1   
    } 
} 
r 
} 

mmergesort<-function(A) { 
    if(length(A)>1) { 
    q <- ceiling(length(A)/2) 
    a <- mmergesort(A[1:q]) 
    b <- mmergesort(A[(q+1):length(A)]) 
    mmerge(a,b) 
} else { 
    return(A) 
} 
} 

#!/usr/bin/env Rscript 
args = commandArgs(trailingOnly=TRUE) 

# args test 
if (length(args)==0 | length(args)==1) { 
stop("Arquivo de entrada e saida devem ser fornecidos (input.txt, output.txt)", call.=FALSE) 
} 

#read file 
input <- read.table(file=args[1], header=F) 

#vector parser 
input <- as.character(input[,1]) 

#sort 
ordenado <- mmergesort(input) 

#write file 
write(ordenado, file=args[2], sep = "\t") 

#end time 
print(Sys.time()-strt) 
+0

有什么理由不能使用诸如'sort'之类的内置函数? https://stat.ethz.ch/R-manual/R-devel/library/base/html/sort.html –

+0

我的意思是,假设你必须阅读每行一个单词的文件,为什么只是你可以' t使用'ordered < - sort(words [,1])''。这不会更容易吗? –

+0

原因必须是O(nlogn),并且r中的正常排序是O(n)。 –

回答

0

我把它(如果u想只是部分代码去13:00-14:00):下面this视频后使用

library(foreach) 
library(doParallel) 

[...] 

#merge sort 
mmerge<-function(a,b) { 
    r<-numeric(length(a)+length(b)) 
    ai<-1; bi<-1; j<-1; 
    foreach(j= 1:length(r)) %do% { 
    if((ai<=length(a) && a[ai]<b[bi]) || bi>length(b)) { 
     r[j] <- a[ai] 
     ai <- ai+1 
    } else { 
    r[j] <- b[bi] 
    bi <- bi+1   
    } 
} 
    r 
} 

[...] 

#number of clusters 
registerDoParallel(4) 

#sort 
ordenado <- mmergesort(input) 

#stop parallel 
stopImplicitCluster() 

[...]