2017-10-20 116 views
0

我正在使用R执行我的分析,我将执行四种算法。分类任务中的所有二元预测变量

1. RF 
2. Log Reg 
3. SVM 
4. LDA 

我有50个预测变量和1个目标变量。我所有的预测变量和目标变量都只有二进制数字0和1。

我有以下问题:

Should I convert them all into factors? 
Converting them into factors, and applying RF algorithms give 100% accuracy, I am very much surprised to see that as well. 
Also, for other algorithms, how should i treat my variables priorly, before feeding them into my other algorithms. 

感谢

+0

https://stats.stackexchange.com/a/112052/1569 –

+0

@HongOoi,即使在测试数据。 – Shivam

回答

2

如果变量/预测是明确的,那么最好是将它们转换为因素。否则,它很可能会被视为数值。

如果您正在执行分类任务,那么最好也将目标/响应变量作为一个因子。

最好还是看看你使用的函数的文档,以确保它们不会将因子转换为数值。

+0

我已经将它们转换成了因素,我不认为,您的答案达到了标准,并且它应该有一个评论。 – Shivam

+0

为什么它不符合标准?你的问题显然是“我应该将它们全部转化为因素吗?” – tpol

+0

如果你不喜欢我的答案,就让它成为。看起来你会寻求帮助,然后期望给出一些让你满意的答案。 – tpol