我有一个非常大的数据集与日期和值。我可以使用线性回归与日期和值来获得预测公式。线性回归与日期
我有日期和使用价值。 我可以将日期转换为数值并获得预测公式,但我认为这不起作用。
你能帮我解决这个用例吗?什么是最好的机器学习技术?我更喜欢线性回归,但不确定如何使用。
我有一个非常大的数据集与日期和值。我可以使用线性回归与日期和值来获得预测公式。线性回归与日期
我有日期和使用价值。 我可以将日期转换为数值并获得预测公式,但我认为这不起作用。
你能帮我解决这个用例吗?什么是最好的机器学习技术?我更喜欢线性回归,但不确定如何使用。
这一切都取决于你如何将日期转换为数字。如果您只是选择一个较小但接近日期字段的最小可能值的日期,并执行该基准日期以来的“天数”,则应该没问题。
您还可以考虑(实验)选择接近日期字段中值的基准日期(在这种情况下,您将同时具有正值和负值)。
采摘日期远在过去一般是不是一个好主意(原因很明显)...
谢谢你的回复。所以1)我们可以使用线性回归的日期? 2)我有从2008年1月31日起的日期,我应该如何开始价值? – user826407
1 - 是的,绝对是... 2 - 取决于你的数据的形状,所以试验,我会先用1/1/2008和类似于2013年1月1日的东西 –
谢谢你,请你告诉我当你说try 1/1/2008是什么意思?我没有得到。你能帮我吗我应该如何保持日期值?我应该把它保持为1吗? – user826407
我没有看到一个很好的理由,为什么任何距离保转型是行不通的。例如。日期到unix-timestamp,然后从所有中心中减去最低的一个。 – sascha
所以你的意思是,如果我有1/1/2008将其转换为uniq时间戳,并使其为0,因为这是我的初始值 – user826407
是的,但其他人也需要减去。它就像'''vector(x0,x1,...) - x0'''(矢量减法; x0,x1从低到高排列!)。 (它也仅适用于底层优化算法的数值鲁棒性,它们不喜欢非常小或非常大的数字;可能不是必需的;对于像SGD这样的大数据算法更为必要) – sascha