这里是我的问题的一个例子使用r和weka。我怎样才能使用元算法与nfold评估方法?
library(RWeka)
iris <- read.arff("iris.arff")
执行nfolds获得分类的合适的精度。
m<-J48(class~., data=iris)
e<-evaluate_Weka_classifier(m,numFolds = 5)
summary(e)
在此提供的结果是通过与数据集的一部分构建模型,并用另一部分测试它获得,因此提供了精确的精度
现在我执行AdaBoost算法来优化分类
的参数m2 <- AdaBoostM1(class ~. , data = temp ,control = Weka_control(W = list(J48, M = 30)))
summary(m2)
这里提供的结果是通过使用相同的数据集来建立模型,也使用相同的数据集来评估它,因此精度不代表真实的生活精度,其中我们使用其他实例进行模型评估。不过,这个程序有助于优化所建模型。
主要问题是我无法优化建立的模型,同时使用未用于构建模型的数据对其进行测试,或者仅使用三重验证方法来获得适当的精度。
我格式化了你的问题。您可能想要为您的问题尝试stats.stackexchange.com。 – 2010-10-06 10:50:37
为什么e2 < - evaluate_Weka_classifier(m2,numFolds = 5)没有做你想要的任何理由? – 2010-10-06 11:01:26
非常感谢Joris格式化问题。 – 2010-10-06 11:09:20