我试过搜索了一下,但是在Spark SQL中只能找到add_month函数,所以最后在这里打开了一个新的线程。将不胜感激任何人可以提供的帮助。在Spark中添加12小时到datetime列
我想在使用sqlContext的Spark SQL的日期列中添加小时12,24和48。我使用的1.6.1版本星火,我需要这样的:
SELECT N1.subject_id, '12-HOUR' AS notes_period, N1.chartdate_start, N2.chartdate, N2.text
FROM NOTEEVENTS N2,
(SELECT subject_id, MIN(chartdate) chartdate_start
FROM NOTEEVENTS
WHERE subject_id = 283
AND category != 'Discharge summary'
GROUP BY subject_id) N1
WHERE N2.subject_id = N1.subject_id
and n2.chartdate < n1.chartdate_start + interval '1 hour' * 12
请注意最后一句话,这是写在PostgreSQL,而这也正是我需要星火SQL。我非常感谢我能得到的任何帮助。
谢谢。
@Ahsan大:)如果你将有性能问题,再看看安东Okolnychyi答案 - 本地功能有可能是推下去。但在这种情况下,我认为不可能推下谓词,因为它在少数表格上运行,所以UDF应该没问题且更易于阅读。 –