我有一个数据帧(“观察”),其格式为H:M
(“时间”)。在第二个数据帧(“间隔”)中,我的时间范围由“From”和“Till”变量定义,格式也为H:M
。以不同时间间隔计算时间戳 - 以跨越午夜的间隔问题
我想统计每个区间内的观测值的数量。我一直在使用data.table
中的between
,这在包含日期时一直没有任何问题。
但是,现在我只有时间戳,没有日期。这导致在跨越午夜(20:00 - 05:59
)的时间间隔中发生的一些问题。这些时间不计入我尝试过的代码中。
实例下
interval.data <- data.frame(From = c("14:00", "20:00", "06:00"), Till = c("19:59", "05:59", "13:59"), stringsAsFactors = F)
observations <- data.frame(Time = c("14:32", "15:59", "16:32", "21:34", "03:32", "02:00", "00:00", "05:57", "19:32", "01:32", "02:22", "06:00", "07:50"), stringsAsFactors = F)
interval.data
# From Till
# 1: 14:00:00 19:59:00
# 2: 20:00:00 05:59:00 # <- interval including midnight
# 3: 06:00:00 13:59:00
observations
# Time
# 1: 14:32:00
# 2: 15:59:00
# 3: 16:32:00
# 4: 21:34:00 # Row 4-8 & 10-11 falls in 'midnight interval', but are not counted
# 5: 03:32:00 #
# 6: 02:00:00 #
# 7: 00:00:00 #
# 8: 05:57:00 #
# 9: 19:32:00
# 10: 01:32:00 #
# 11: 02:22:00 #
# 12: 06:00:00
# 13: 07:50:00
library(data.table)
library(plyr)
adply(interval.data, 1, function(x, y) sum(y[, 1] %between% c(x[1], x[2])), y = observations)
# From Till V1
# 1 14:00 19:59 4
# 2 20:00 05:59 0 # <- zero counts - wrong!
# 3 06:00 13:59 2
的一个结束时那些永远是你的时间间隔,或者这只是一个大一个小例子数据集? – SymbolixAU
更大集合的相同结构 – MLEN
使用'adply'与1的边距类型会使data.table的使用无关紧要。 –