2012-12-06 31 views
3

我正在读一个CSV到一个变量“东西”,并强迫第一列到POSIXct(此列只有时间戳,形式为“2012-12-04 17:49:52”,所以这个效果很好)。POSIXct平等工作奇怪

stuff[,1]<-as.POSIXct(stuff[,1]) 

因为我有好几天的价值的数据,我则试图通过日期,打破东西:

control <- subset(stuff,as.Date(stuff[,1]) == '2012-11-27') 
control.1 <- subset(stuff,as.Date(stuff[,1]) == '2012-11-28') 

我觉得这不会将数据增长日期为分割我会期待的。 尾(控制)告诉我,最后一个值是在2012-11-27 15:54:21,而头(control.1)显示它的第一个值是2012-11-27 16:04:35。

因为某些原因,平等因此似乎在16:00左右的某个地方发生。我试图在强制使用POSIXct时指定时区,但这也没有帮助。有什么我可以做的白天子集(这是否有失败的原因)?我想提一提,我需要将小时信息保存在那里,因为我打算随后使用它来分割数据。

+0

这是因为时区。您可以在as.Date中指定时区,默认情况下它是UTC,因此当您将时间戳转换为日期时,一些将落在不同的日期。确保你的时区在as.Date匹配你的时间戳时区 – ilya

+0

我试图修复时间戳,说'stuff [,1] < - as.Date(stuff [,1],tzone =“PST”)',并指定时间区域也在平等检查中,但我得到了相同的结果。 有趣的是,我得到了正确的结果,如果我这样做: 'control < - subset(cases,cases [,1] <= as.POSIXct('2012-11-27 23:59:59'))' – padips

回答

0

也许cut可能对您有用,但如果没有您的数据样本来重现您遇到的问题,则很难确定。

以下是使用cut创建日常子集的最简单示例。

set.seed(1) # So you can get the same numbers as I do 
MyDates <- ISOdatetime(2012, 1, 1, 0, 0, 0, tz = "GMT") + sample(1:500000, 100) 
class(MyDates) 
# [1] "POSIXct" "POSIXt" 
split(MyDates, cut(MyDates, breaks="1 day")) 
$`2012-01-01` 
[1] "2012-01-01 08:34:53 GMT" "2012-01-01 17:26:15 GMT" "2012-01-01 01:51:35 GMT" 
[4] "2012-01-01 14:59:28 GMT" "2012-01-01 03:14:25 GMT" "2012-01-01 09:48:56 GMT" 
[7] "2012-01-01 13:48:48 GMT" "2012-01-01 11:41:58 GMT" "2012-01-01 16:53:56 GMT" 
[10] "2012-01-01 19:54:00 GMT" "2012-01-01 08:11:02 GMT" 

$`2012-01-02` 
[1] "2012-01-02 12:52:35 GMT" "2012-01-02 04:00:41 GMT" "2012-01-02 04:36:26 GMT" 
[4] "2012-01-02 00:31:17 GMT" "2012-01-02 05:27:47 GMT" "2012-01-02 13:06:44 GMT" 
[7] "2012-01-02 23:16:05 GMT" "2012-01-02 01:51:43 GMT" "2012-01-02 09:59:46 GMT" 
:::: 
:::: 
:::: 
[13] "2012-01-05 10:25:04 GMT" "2012-01-05 20:34:21 GMT" "2012-01-05 11:56:40 GMT" 
[16] "2012-01-05 02:56:40 GMT" "2012-01-05 09:08:00 GMT" "2012-01-05 02:45:00 GMT" 
[19] "2012-01-05 12:09:45 GMT" "2012-01-05 14:42:59 GMT" "2012-01-05 16:35:56 GMT" 

$`2012-01-06` 
[1] "2012-01-06 06:08:22 GMT" "2012-01-06 04:46:31 GMT" "2012-01-06 11:12:12 GMT" 
[4] "2012-01-06 17:45:37 GMT" "2012-01-06 09:48:54 GMT" "2012-01-06 00:47:02 GMT" 
[7] "2012-01-06 06:46:24 GMT" "2012-01-06 01:33:21 GMT" "2012-01-06 03:53:53 GMT" 
[10] "2012-01-06 00:01:45 GMT" "2012-01-06 13:23:54 GMT" "2012-01-06 01:40:54 GMT" 
+0

这很好。谢谢! – padips