2017-09-13 83 views
0
X = df1.iloc[:, 1:].values 
y = df1.iloc[:, 0].values 

from sklearn.cross_validation import train_test_split 
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.25,  random_state=0) 

from sklearn.neighbors import KNeighborsClassifier 
knn = KNeighborsClassifier(n_neighbors=3, metric='minkowski', p=2) 
knn.fit(X_train, y_train) 

ValueError: could not convert string to float: '2/1/2011' 

我打算使用这些功能制作投注模型。 FTR =全职结果:(H)OME,(d)原料,(A)的方式主队的 odds_H =赔率如何在我的算法上使用我的日期特征?

+0

什么是属性 –

+0

你可以用文本格式而不是“PNG”来获得你的'df',以便其他人可以使用这些数据来模拟你的问题吗?您可以简单地复制/粘贴数据并将其标记为代码或Blockquote。 –

回答

0

在ML,有如果您将日期作为功能,则可以执行相当多的操作。已经在过去是有用的变换的一些例子:

  • 天数,月数,年数,季度数
  • 工作日
  • 季节(如春天= 0,夏天= 1 ... )
  • year_day号(1月= 0,31月= 364)
  • 天数自/一些事件(在你的例子之前,这可能因为以前的比赛是天数)
  • 而很多更多...

有一些警告,但一般来说,它应该很容易从一个datetime对象到这些表示(作为整数)的每个表示。取决于您的特定数据集,其中一些可能非常有用。

相关问题