2017-11-25 396 views
-1

我有一个非常大的数据集与日期和值。我可以使用线性回归与日期和值来获得预测公式。线性回归与日期

我有日期和使用价值。 我可以将日期转换为数值并获得预测公式,但我认为这不起作用。

你能帮我解决这个用例吗?什么是最好的机器学习技术?我更喜欢线性回归,但不确定如何使用。

+1

我没有看到一个很好的理由,为什么任何距离保转型是行不通的。例如。日期到unix-timestamp,然后从所有中心中减去最低的一个。 – sascha

+0

所以你的意思是,如果我有1/1/2008将其转换为uniq时间戳,并使其为0,因为这是我的初始值 – user826407

+0

是的,但其他人也需要减去。它就像'''vector(x0,x1,...) - x0'''(矢量减法; x0,x1从低到高排列!)。 (它也仅适用于底层优化算法的数值鲁棒性,它们不喜欢非常小或非常大的数字;可能不是必需的;对于像SGD这样的大数据算法更为必要) – sascha

回答

0

这一切都取决于你如何将日期转换为数字。如果您只是选择一个较小但接近日期字段的最小可能值的日期,并执行该基准日期以来的“天数”,则应该没问题。

您还可以考虑(实验)选择接近日期字段中值的基准日期(在这种情况下,您将同时具有正值和负值)。

采摘日期远在过去一般是不是一个好主意(原因很明显)...

+0

谢谢你的回复。所以1)我们可以使用线性回归的日期? 2)我有从2008年1月31日起的日期,我应该如何开始价值? – user826407

+1

1 - 是的,绝对是... 2 - 取决于你的数据的形状,所以试验,我会先用1/1/2008和类似于2013年1月1日的东西 –

+0

谢谢你,请你告诉我当你说try 1/1/2008是什么意思?我没有得到。你能帮我吗我应该如何保持日期值?我应该把它保持为1吗? – user826407