2016-01-21 73 views
1

我想按年份重复列出一个列表。如果这些文件具有相同的名称,这可能很容易解决,但事实并非如此。从列表中重复元素的子集对

名单如下:

dput(list_raster) 
    c("F101992.v4b_web.stable_lights.avg_vis.tif", "F101993.v4b_web.stable_lights.avg_vis.tif", 
    "F101994.v4b_web.stable_lights.avg_vis.tif", "F121994.v4b_web.stable_lights.avg_vis.tif", 
    "F121995.v4b_web.stable_lights.avg_vis.tif", "F121996.v4b_web.stable_lights.avg_vis.tif", 
    "F121997.v4b_web.stable_lights.avg_vis.tif", "F121998.v4b_web.stable_lights.avg_vis.tif", 
    "F121999.v4b_web.stable_lights.avg_vis.tif", "F141997.v4b_web.stable_lights.avg_vis.tif", 
    "F141998.v4b_web.stable_lights.avg_vis.tif", "F141999.v4b_web.stable_lights.avg_vis.tif", 
    "F142000.v4b_web.stable_lights.avg_vis.tif", "F142001.v4b_web.stable_lights.avg_vis.tif", 
    "F142002.v4b_web.stable_lights.avg_vis.tif", "F142003.v4b_web.stable_lights.avg_vis.tif", 
    "F152000.v4b_web.stable_lights.avg_vis.tif", "F152001.v4b_web.stable_lights.avg_vis.tif", 
    "F152002.v4b_web.stable_lights.avg_vis.tif", "F152003.v4b_web.stable_lights.avg_vis.tif", 
    "F152004.v4b_web.stable_lights.avg_vis.tif", "F152005.v4b_web.stable_lights.avg_vis.tif", 
    "F152006.v4b_web.stable_lights.avg_vis.tif", "F152007.v4b_web.stable_lights.avg_vis.tif", 
    "F152008.v4b_web.stable_lights.avg_vis.tif", "F162004.v4b_web.stable_lights.avg_vis.tif", 
    "F162005.v4b_web.stable_lights.avg_vis.tif", "F162006.v4b_web.stable_lights.avg_vis.tif", 
    "F162007.v4b_web.stable_lights.avg_vis.tif", "F162008.v4b_web.stable_lights.avg_vis.tif", 
    "F162009.v4b_web.stable_lights.avg_vis.tif", "F182010.v4d_web.stable_lights.avg_vis.tif", 
    "F182011.v4c_web.stable_lights.avg_vis.tif", "F182012.v4c_web.stable_lights.avg_vis.tif", 
    "F182013.v4c_web.stable_lights.avg_vis.tif") 

正如你可以看到有几个一年文件重复(i.e. 1994, 1997-1999, 2000-2003, etc.)。我的想法是使用raster::overlay函数构建一个包含重复年份文件对的列表,以表示它们的值。我曾尝试以下:

library(stringr) 
    #Create a list of only the years of the files 
    year_list <- lapply(list_raster, str_sub, 4, 7) 
    #Select the duplicate years 
    duplicated_years <- year_list[duplicated(year_list)] 
    #Select the duplicate file-years 
    duplicated_rasters <- list_raster[lapply(list_raster, str_sub, 4, 7) %in% duplicated_years] 
    #Make all the pairs between files 
    duplicated_rasters <- combn(duplicated_rasters, 2, simplify=T) 

不过,我现在有很多对的矩阵,我有点卡住进行选择留级的。有没有简单的方法来做到这一点?我认为我的缺乏经验让我“超编码”这一点。

+0

请提交一个最小的可重复的例子。请参阅:[如何创建最小,完整和可验证示例](http://stackoverflow.com/help/mcve)。具体来说,你应该使用dput()' –

+0

分享你的(可重现性极低的)数据。你好Eric,字符串'list_raster'的列表是我的“数据”。我只想选择该列表的年份中的重复项。 –

+1

埃里克的意思是执行dput(list_raster)并将输出粘贴到您的问题中,以便它更容易帮助您。 – andrnev

回答

1

您可以在此处使用by按年份组应用功能(发生时为overlay)。当然,你应该先提取一年的文件名:

by(xx,INDICES=substr(xx,4,7),FUN = function(x)## function body) 

其中XX为您的文件列表:

dput(head(xx)) 
c("F101992.v4b_web.stable_lights.avg_vis.tif", "F101993.v4b_web.stable_lights.avg_vis.tif", 
"F101994.v4b_web.stable_lights.avg_vis.tif", "F121994.v4b_web.stable_lights.avg_vis.tif", 
"F121995.v4b_web.stable_lights.avg_vis.tif", "F121996.v4b_web.stable_lights.avg_vis.tif" 
) 
+0

by()似乎不起作用。它显示错误:'函数(类,fdef,mtable)中的错误:无法找到函数'覆盖'的签名'因子','失踪'''的继承方法。 –