2016-04-22 77 views
0

我试图用三种不同的传感器数据进行预测。每个传感器都具有周期性,并且测量时刻不相同(例如sensor1data_time = 10:01; sensor2data_timestamp = 10:03; sensor3data_timestamp = 10:05)。RapidMiner TimeStamp预处理

我为演示手动完成了这项任务,但现在我需要自动完成此任务以开发预测模型。

推荐任何预处理任务?

在此先感谢

回答

2

我会围绕时间到最近的十分钟。要使用的运营商是Generate Attributes。我倾向于使用自01-01-1970以来的秒数。以下片段显示您可以使用的功能。我假设你有一个名为datestr的属性,它包含这种格式的日期13-01-2016 23:01:01。

attribute name function expression  
------------------------------------------------------------------- 
date    date_parse_custom(datestr, "dd-MM-yyyy HH:mm:ss") 
epochdate   date_diff(date_parse(0), date)/1000 
dateToTenMins  600*round(epochdate/600) 

时代日期以毫秒为单位,因此除以1000会得到秒数。

+0

我明白你的意思了。感谢您的帮助。但是,如果有多个值轮回到相同的时间戳,我可以使用'FilterExamples'操作符来删除重复的值吗? – Havor

+0

您可以使用'Aggregate'运算符来统计具有相同时间戳的示例数量。你会期望从每个传感器的每个时间戳看到1。 – awchisholm

+0

真的有用你的意见:)再多一个问题。我不明白你为什么使用'600'。我的意思是,如果不是四舍五入到最接近的五分钟,以防我想绕到较低的小时?例如,如果1:03和1:53我想为他们两个获得1点??我怎么能这样做? – Havor