2017-04-16 93 views
1

我构建了一个RNN,用于预测未查看查询的查询执行时间。我想添加时间戳作为功能,因为它可能有助于估计服务器是否忙碌。我怎样才能将日期/时间变量与我的查询向量结合起来并将它提供给我的RNN模型?
是的,我可以手动计算时间增量,并将其作为浮点数来提供,但这就像作弊。将时间戳输入RNN的正确方法?

回答

2

无论您使用的是哪种模型,您的目标都是将日期 - 时间戳记转换为数字特征,以便了解服务器何时繁忙。

如果您有周期性的服务器使用情况,那么您可能需要创建一个周期性数字功能。例如。小时#(0-23)或分钟,或者甚至每周#(0-6)。如果您随时间呈线性趋势(认为服务器使用率平均缓慢上升),那么您可能还需要将日期 - 时间戳记转换为“时间以来...”的正确缩放功能。例如。自第一次观察以来的天数,或周数等...

我希望有所帮助。

+0

正确 - 目标是知道服务器是否忙碌。我是否正确地阅读了答案,没有“标准”或“正确”的方式将时间戳转换为float/tf变量以将我的模型作为特征? – dv3

+0

这是特定的问题。如果您有定期使用,只使用时间戳的浮点表示是不够的。随着时间的推移,浮动表示将会持续增加。这对于时间序列中的线性趋势非常有用,但对于定期或季节性数据则不是。您始终可以创建两种类型的功能。 – nfmcclure

+0

嗯,谢谢,我想我必须尝试不同的版本... – dv3