我想选择可用的最佳功能子集,以区分两个要加入到我构建的统计框架中的类,其中功能不是独立的。选择功能的最佳子集
看过机器学习中的功能选择方法后,它似乎分为三个不同的类别:过滤器,包装器和嵌入式方法。过滤方法可以是:单变量或多变量。使用Filter(多变量)或包装器方法确实有意义,因为两个 - 据我了解 - 寻找最佳子集,但是,因为我没有使用分类器,所以如何使用它?
是否有意义应用这样的方法(例如递归功能 消除)到DT或随机森林分类,其中 有规则在那里,然后特征拿得到最好的子集,并喂它 到我的框架?**
而且,因为大多数提供的算法Scikit学习是 单变量算法,是否有任何其他基于Python的库 提供更多的子集的特征选择算法?
非常感谢,这是真正有用的......那么,这是否意味着我可以确实使用分类器来确定特征选择步骤中的重要特征,然后使用此重要特征将其馈送到另一个框架(与特征选择步骤中使用的分类器不同)? – Ophilia
我不明白为什么不。分类器都是关于如何利用X数据来清除y数据中所需的输出信号。他们都需要找到哪些信息在某种程度上实际上是信息性的(vs噪声)。分类器可能不同意信号中重要的内容,但作为特征选择步骤应该没问题。 – Erotemic
非常感谢!这真的很有帮助 – Ophilia