2011-02-27 116 views
6

我们知道有一千个分类器,最近有人告诉我说,有人说adaboost就像是出的一个最新的分类算法

  • 有更好的算法(与 在投票的想法)
  • 什么是艺术的 的状态classifiers.Do你有一个例子?

回答

1

Hastie et al。 (2013年,统计学习元素)得出结论认为梯度增压机是最好的“现成”方法。独立于您的问题。 定义(参见第352页): “现成的”方法是可以直接将数据应用于数据,而不需要耗费大量时间的数据预处理或仔细调整学习过程。事实上,Breiman(NIPS Workshop,1996)提到AdaBoost将树作为“世界上最好的现成分类器”(参见Breiman(1998))。

5

首先,adaboost是一种元算法,与您最喜欢的分类器一起使用(在其上)。其次,在一个问题领域工作得很好的分类器在另一个问题领域通常效果不佳。请参阅No Free Lunch维基百科页面。所以,你的问题不会有答案。不过,了解人们在实践中使用的内容可能很有意思。

+0

那么,你的人使用什么??? – cMinor 2011-02-27 16:57:59

2

Weka是一个非常流行和稳定的机器学习库。它已有相当长的一段时间,并在Java写。

+0

最近我看到一位博士使用这个,所以我不得不承认你很快就给出了答案。 – cMinor 2011-03-01 00:34:49

3

Weka和Mahout不是算法......他们是机器学习库。它们包括各种算法的实现。因此,最好的选择是挑选一个库并尝试一些不同的算法,以查看哪个算法最适合您的特定问题(“最佳效果”将成为培训成本,分类成本和分类准确度的函数)。

如果是我,我会从朴素贝叶斯,最近邻居和支持向量机开始。它们代表完善的,广为人知的方法,而且有很多不同的折衷。朴素贝叶斯便宜,但不是特别准确。 K-NN在训练期间价格便宜,但在分类过程中(可能)价格昂贵,而且通常非常准确,可能容易受到过度训练的影响。支持向量机训练昂贵,并且有许多元参数需要调整,但它们应用便宜,一般至少与k-NN一样精确。

如果您告诉我们您想要解决的问题的更多信息,我们可能会提供更专注的建议。但如果你只是在寻找一个真正的算法,那就没有一个 - 没有免费午餐定理保证了。