2017-05-31 29 views
1

我想用openxlsx读取带时间序列数据的大型excel文件。我发现如果数字向量参数超过一定数量的元素,convertToDateTime将开始省略时间。我的代码如下所示:Openxlsx convertToDateTime忽略大数据集的时间

ts <- readWorkbook(my.wb, sheet = as.character(r[["dSheet"]]), 
       startRow = 2, cols = 1, 
       colNames=FALSE, detectDates=FALSE) 
colnames(ts) <- c("dt") 
> head(convertToDateTime(ts$dt[1:30830])) 
[1] "2016-11-23 15:20:00 MST" "2016-11-23 15:24:59 MST" 
[3] "2016-11-23 15:30:00 MST" "2016-11-23 15:34:59 MST" 
[5] "2016-11-23 15:40:00 MST" "2016-11-23 15:45:00 MST" 

> head(convertToDateTime(ts$dt[1:30840])) 
[1] "2016-11-23 MST" "2016-11-23 MST" "2016-11-23 MST" "2016-11-23 MST" 
[5] "2016-11-23 MST" "2016-11-23 MST" 

方的问题:如果你在我的原代码,看看元素#2(2016年11月23日15时24分59秒),这实际上应该是15:25。如果有一个简单的方法来解决这个问题,请让我知道...

这里有一个工作示例:

>library("openxlsx") 
>dates <- runif(31000, 41000, 42000) 
>head(convertToDateTime(dates[1:5000])) 

[1] "2013-05-29 09:34:28 MDT" "2014-07-01 03:52:13 MDT" 
[3] "2012-06-02 09:27:47 MDT" "2012-05-06 13:42:04 MDT" 
[5] "2014-09-26 04:50:36 MDT" "2013-10-26 03:14:00 MDT" 

> head(convertToDateTime(dates[1:10000])) 
[1] "2013-05-29 MDT" "2014-07-01 MDT" "2012-06-02 MDT" "2012-05-06 MDT" 
[5] "2014-09-26 MDT" "2013-10-26 MDT" 

是否有此行为的修复,或者您会推荐尝试一种完全不同的方法(实施转换)?

非常感谢您的帮助!

回答

0

我在Converting numeric time to datetime POSIXct format in R找到了解决我的问题的解决方法。只需3600 * 24相乘的过人之处小时才能在几秒钟的时间跨度和使用as.POSIXCT正常工作:

> dates <- runif(30000, 41000, 42000) 
> ts1 <- convertToDateTime(dates) 
> ts2 <- as.POSIXct(dates*3600*24, tz="GMT", origin = "1900-01-01") 
> head(ts1) 
[1] "2013-10-04 MDT" "2012-04-04 MDT" "2014-06-12 MDT" "2013-01-24 MST" 
[5] "2012-09-12 MDT" "2014-11-11 MST" 
> head(ts2) 
[1] "2013-10-06 02:43:24 GMT" "2012-04-06 11:59:54 GMT" 
[3] "2014-06-14 16:43:06 GMT" "2013-01-26 00:25:17 GMT" 
[5] "2012-09-14 07:26:47 GMT" "2014-11-13 18:52:03 GMT" 

因为这个作品如此之大,我不明白openxlsx” convertToDateTime功能的工作流的优势。将as.POSIXct与openxlsx的getDateOrigin()结合使用也解决了我在原始问题中描述的舍入问题。