我有一个具有日期格式为dd-MMM-yyyy hh:mm的列的火花数据帧。2特定时间范围之间的Spark DataFrame查询
怎么办TIMERANGE查询像 -
找到2日期间和 下午4点至凌晨1点的特定时间范围内的所有行。
这是SQL可以通过使用DATEPART Specific Time Range Query in SQL Server
如何做星火数据帧相同。
例如,
我想找到所有的23-MAR-2016之间的行,直到25-MAR-2016, 时间范围内13:00:00至18:00:00仅限。
所以我必须得到只有一行作为结果。
var input = spark.createDataFrame(Seq(
(13L, "Abhi c", "22-MAR-2016 09:10:12"),
(11L, "VF", "23-MAR-2016 16:24:25"),
(12L, "Alice Jones", "24-MAR-2016 19:20:25")
)).toDF("id", "name", "time")
input.filter("time between '23-MAR-2016' and '25-MAR-2016'").show()
+---+-----------+--------------------+
| id| name| time|
+---+-----------+--------------------+
| 11| VF|23-MAR-2016 16:24:25|
| 12|Alice Jones|24-MAR-2016 19:20:25|
+---+-----------+--------------------+
我上面的查询只是过滤日期,甚至我可以给时间,但如何获得在每一天的时间范围内的行。