-2

当使用机器学习中的功能并以矩阵表示它们时,推荐的方法是将每天的小时和星期几表示为值预测模型的功能?什么是最好的方式来表示星期几和星期几作为机器学习中的价值预测模型的一个特征?

对于所有小时值和小时值1使用0表示将这些属性表示为特征的首选方式?一周中的哪一天都一样?

感谢

+0

答案看来你的问题集中在机器学习,并没有直接关系编程,使其题外话这里。您可能会发现[交叉验证](https://stats.stackexchange.com)或[Data Science SE](https://datascience.stackexchange.com)更适合这些问题。 –

回答

0

在这种情况下,有一个每周定期趋势和长期趋势向上。所以,你会想编码两个时间变量:

  • DAY_OF_WEEK
  • absolute_time

一般

有几种常见的时间框架是趋势发生了:

  • absolute_time
  • DAY_OF_YEAR
  • DAY_OF_WEEK
  • month_of_year
  • HOUR_OF_DAY
  • MINUTE_OF_HOUR

寻找在所有这些趋势。

古怪的趋势

查找奇怪的趋势了。例如,你可能会看到罕见的,但持续的基于时间的趋势:

  • is_easter
  • is_superbowl
  • is_national_emergency 等

这些通常需要您交叉引用您对一些外部源数据将事件映射到时间。

为什么图?

有两个原因,我认为绘图非常重要。

古怪的趋势: 虽然总的趋势可以很容易实现自动化(只是每次添加的话),怪异的走势往往需要一个人的眼睛和世界的知识发现。这是制图如此重要的一个原因。

数据错误: 数据经常出现严重错误。例如,您可能会发现日期以两种格式编码,并且只有其中一个已正确加载到您的程序中。有这么多的这样的问题,他们是非常普遍的。这是我认为绘图很重要的另一个原因,不仅是时间序列,而且是任何数据。从https://datascience.stackexchange.com/questions/2368/machine-learning-features-engineering-from-date-time-data