2010-07-02 90 views
40

Weka可能是最受欢迎的通用机器学习库。但是我的经验可能会很慢。最快的通用机器学习库?

我一直在看SharkWafflesdlibPlearn,并MLC++作为替代品。其中,Shark和dlib看起来最有前途。

有没有人有任何经验,当涉及到这些库的性能测试?

+0

您可能也会对http://code.google.com/p/eureqa-api/感兴趣,它会发现高性能的公式查找 – Inverse 2010-07-02 18:28:11

+0

完全取决于您想要学习的哪种模型。 CRF? SVM?嗯? – bmargulies 2010-07-04 02:55:05

+4

Weka **非常慢**。 – 2012-06-29 08:58:06

回答

39

对我来说,最重要的是“这个工具包是否具有我想要尝试的算法或功能?”由于这些工具包提供了相当多样化的功能,因此您应该首先尝试缩小您想要执行的操作。因此,例如,如果您有一个渴望尝试不同进化优化算法的愿望,那么我会选择Shark这样的东西。另一方面,我更喜欢dlib作为我的大部分工作,但这并不意味着很多,因为我写了:)但是,如果您对二进制分类感兴趣,那么让我建议我目前的最爱方法为,svm_c_ekm_trainer。我经常使用它来训练数十万数据集上的非线性SVM。它通常运行几分钟(有时甚至几秒钟),而经典的SMO算法则需要数小时或数天才能完成。

对于不久前提出的类似问题,也有一些很好的答案:Which machine learning library to use

+1

谢谢戴维斯!用dlib做的很棒!我真的只是在寻找具有很多功能的东西,以便我可以在大多数情况下使用它,但是可以根据需要分支出其他东西。 – griffin 2010-07-06 13:48:20