2016-06-09 145 views
0

所以我试图循环一个包含30个netcdf文件的文件夹,从多个图层中拉出一个变量,处理它,并且将这个循环的每次迭代都绑定到一个对象上。我正在处理每日数据,我希望每列代表所述变量的1天。我似乎很接近,但无法完成。 这里是我的循环:循环浏览netcdf文件并将每次迭代循环到一个对象

files <- list.files(path="../07 epic month 1", pattern="*.nc", full.names=T, recursive=FALSE) 
mydata <- data.frame() 
# Loop over files 
for(i in seq_along(files)) { 
nc = open.ncdf(files[i]) 

i = get.var.ncdf(nc,'NO3') 
i <- i[ , ,c(9:16, 31:36) ] 
    i <- as.vector(i) 
    i = data.frame(i) 
     i[is.na(i)] <- "0" 
     i[ , ] <- sapply(i[ , ], as.numeric) 
      i <- as.matrix(i) 
      i <- split(i ,1:137241) 
       i <- data.frame(i) 
       i <- as.matrix(i) 
        i <- t(i) 
        i <- rowSums(i) 
         i <- data.frame(i) 
         mydata[[i]] 
} 

但是当我运行的循环我得到这个错误:

Error in .subset2(x, i, exact = exact) : invalid subscript type 'list' 
+0

将'browser()'放在代码中的某个地方,并在代码执行期间检查变量的状态 –

回答

0

我不是你从每个文件中提取什么完全清楚,但可以使用lapply在循环中读取文件。我无法测试此解决方案,因为没有您提供的样本数据和预期的输出。但是,我相信这会开始让你进一步工作。

mydata_files <- lapply(list.files(), FUN = function(x) { 
     nc <- open.ncdf(files(x)) 
     i <- get.var.ncdf(nc,'NO3') 
     data <- i[ , ,c(9:16, 31:36) ] 
     result <- rowSums(data) 
     return(result) 
}) 
result <- do.call("cbind", mydata_files) 
0

好吧伙计们,我明白了。只需要一点点时间跑步。

files <- list.files(path="../07 epic month 1", pattern="*.nc", full.names=T, recursive=FALSE) 
mydata <- 1:137241 
mydata = data.frame(mydata) 
# Loop over files 
for(i in seq_along(files)) { 
nc = open.ncdf(files[i]) 

# Read the whole nc file and read the length of the varying dimension (here, the 3rd dimension, specifically time) 
out = get.var.ncdf(nc,'NO3') 
    out <- out[ , ,c(9:16, 31:36) ] 
    out <- as.vector(out) 
    out = data.frame(out) 
     out[is.na(out)] <- "0" 
     out[ , ] <- sapply(out[ , ], as.numeric) 
      out <- as.matrix(out) 
      out <- split(out ,1:137241) 
       out <- data.frame(out) 
       out <- as.matrix(out) 
        out <- t(out) 
        out <- rowSums(out) 
         mydata <- cbind(mydata, out) 

}