2014-09-23 84 views
0

我有两个表。从2012年到2014年有3小时的信息。它看起来像这样:填补了表中的空白

1 01.06.2012 00:00 10 0 
2 01.06.2012 03:00 10 0 
3 01.06.2012 06:00 10 6 
4 01.06.2012 09:00 7,5 0 
5 01.06.2012 12:00 6 2,5 
6 01.06.2012 15:00 6 0 
7 01.06.2012 18:00 4 0 
8 01.06.2012 21:00 4 0 
9 02.06.2012 00:00 0 0 
10 02.06.2012 03:00 0 0 

其他表是同一时间,但与1分钟的时间,它没有数据。

1 01.06.2012 00:00 3 1 
2 01.06.2012 00:01 3 1 
3 01.06.2012 00:01 3 1 
4 01.06.2012 00:03 3 1 
5 01.06.2012 00:03 3 1 
6 01.06.2012 00:05 3 1 
7 01.06.2012 00:05 3 1 
8 01.06.2012 00:07 3 1 
9 01.06.2012 00:08 3 1 
10 01.06.2012 00:09 3 1 
11 01.06.2012 00:10 3 1 

现在,我需要第二个,第二个表的第3行的值相关联的第一,所以如果从第二个表中的时间戳timestamp(i)和第一台的timestamp(i+1)之间将采取B(i)C(i)并复制它们。 我有这个代码,但正如您从上面可以看到的,它不会将正确的值放入。3 & 1而不是10 & 0

clouds <- read.csv('~/2012-2014 clouds info.csv', sep=";", header = FALSE) 
cloudFull <- read.csv('~/2012-2014 clouds.csv', sep=";", header = FALSE) 

for (i in 1:nrow(cloudFull)){ 
    dateOne <- strptime(cloudFull[i,1], '%d.%m.%Y %H:%M') 

    for (j in 1:nrow(clouds)){ 
    bottomDate = strptime(clouds[j,1], '%d.%m.%Y %H:%M') 
    upperDate = strptime(clouds[j+1,1], '%d.%m.%Y %H:%M') 
    if ((dateOne >= bottomDate) && (dateOne < upperDate)) { 
     cloudFull[i,2] <- clouds[j,2] 
     cloudFull[i,3] <- clouds[j,3] 
     break 

    } 

    } 
} 

write.csv(cloudFull, file = 'cc.csv') 

我该怎么办?

+1

假设第二数据集是cloudFull,你的代码为我工作,并给出了预期的结果。编写像这样循环的一个问题是它们有混淆工作空间的副作用,所以也许另一个变量导致问题。重新启动你的会话或删除所有变量,并开始新鲜 – rawr 2014-09-23 12:41:24

+0

试图做到这一点,仍然有相同的结果。我甚至不知道3和1来自哪里。 – 2014-09-24 04:35:59

回答

0

以下可以是有益的:

ddf = rbind(df1, df2) 
ddf$V2 = as.Date(as.character(ddf$V2), format="%d.%m.%Y") 
ddf = cbind(ddf, do.call(rbind, strsplit(as.character(ddf$V3),':'))) 
ddf = ddf[order(ddf$"1",ddf$"2"),] 
ddf = ddf[!duplicated(ddf$V3),] 
ddf 
    V1   V2 V3 V4 V5 1 2 
1 1 2012-06-01 00:00 10 0 00 00 
12 2 2012-06-01 00:01 3 1 00 01 
14 4 2012-06-01 00:03 3 1 00 03 
16 6 2012-06-01 00:05 3 1 00 05 
18 8 2012-06-01 00:07 3 1 00 07 
19 9 2012-06-01 00:08 3 1 00 08 
20 10 2012-06-01 00:09 3 1 00 09 
21 11 2012-06-01 00:10 3 1 00 10 
2 2 2012-06-01 03:00 10 0 03 00 
3 3 2012-06-01 06:00 10 6 06 00 
4 4 2012-06-01 09:00 7 5 09 00 
5 5 2012-06-01 12:00 6 2 12 00 
6 6 2012-06-01 15:00 6 0 15 00 
7 7 2012-06-01 18:00 4 0 18 00 
8 8 2012-06-01 21:00 4 0 21 00 

列 '1' 和 '2' 是从V3和可以容易地与命令删除:

ddf = ddf[,-c(6,7)] 
+0

但如果你看V4超过第一行,它仍然是不正确的?我不知道3和1从哪里来。 – 2014-09-24 04:31:34