1
假设我有如下训练数据:机器学习测试数据需要有列名吗?
Age:12 Height:150 Weight:100 Gender:M
Age:15 Height:145 Weight:80 Gender:F
Age:17 Height:147 Weight:110 Gender:F
Age:11 Height:144 Weight:130 Gender:M
我训练我的数据,并得到了模型中,如果我需要通过对预测一个试验观察后,我是否需要与列名如下发送数据?
Age: 13 Height:142 Weight :90
我一些情况下,我看到人们在一个阵列发送测试数据,而列名。我不确定算法是如何工作的。
注意:我使用python scikit-learn,我的训练数据是dataFrame。所以我不确定我的测试数据是否也应该是dataFrame格式
感谢Rolando ..考虑到我已经使用train_test_split或K-fold CV对足够的数据进行了训练并完成了评估。现在,我只需要发送一个测试观察数据(例如,我从前端工具传递数据),我需要找到一种方法将来自用户的输入数据作为数据框放入相应的列名称中,并将其传递给预测功能正确? –
@GopalK没有看到你的代码很难判断你是否严格需要传递一个数据框。但是,是的,'predict'的输入是一系列与您传递给'fit'的格式相同的观察值。 – Rolando