我的问题是,我应该先对整个数据集进行特征选择selectkbest
sklearn功能,然后partion数据集中到训练和测试设置或者我应该在训练和测试datset执行selectkbest
他们已分区之后?在第二个是那里不同的k-特征将被选择用于测试数据集比被用于训练的可能性?我对机器学习非常陌生,最近刚刚学习了一些关于特征选择的知识。在特征选择,我应该使用SelectKBest培训和测试单独数据集?
我用单变量特征选择例如这里了解selectkbest - http://scikit-learn.org/stable/modules/feature_selection.html为例