我正在为我的数据进行QSAR研究,并在通过DRAGON软件运行我的结构并获取描述符后,剩下383个描述符(移除常量和全部)。 现在我想对我的数据执行特征选择。其中n = 26和p = 383。那么我应该遵循什么方法? 我已经做了一些明智的回归分析以及遗传算法研究,以获得7个非常合适的描述符的R2值为0.831。 但我想尝试其他方法,例如随机森林方法,PLS或PCA来处理我的数据。我使用相同的R。因此,可以使用的包的任何想法。我已经与Caret和Boruta包合作。 Plus交叉验证研究包的任何想法。我需要执行LOOCV和Bootstrap。R中用于QSAR数据的特征选择用于回归分析
感谢您的帮助。
您有26个观察值和383个潜在特征?这是一个TALL任务...通常,我将通过使用每个子集上的特征选择来一次循环几个变量,并随时更新获胜变量。 – Jason 2015-03-08 22:09:52
谢谢杰森。即使我在第一种方法中也是这样做的。将数据集分成许多子集,然后用于特征选择。但是我听说随机森林并且要求特征选择方法可以与这个庞大的数据集一起工作。所以我只想知道是否有人知道如何在R中实现它! – 2015-03-11 04:07:01