2008-10-28 157 views

回答

10

根据每年KDnuggets民意调查2007年,2008年和2009年,RapidMiner是其中的数据挖掘专家世界范围内使用最广泛的开源数据挖掘解决方案: KDnuggets Data Mining Tool Poll 2009

RapidMiner是开源的,100%的Java ,RapidMiner更加灵活,并提供比Weka和KNIME更多的功能。关于SVM实现:Weka带有一个这样的实现(LibSVM),而RapidMiner提供了四个SVM实现(LibSVM,MySVM,EvoSVM,SMO-SVM),其中一些实现了更多高级特性。

1

我用Weka的在高中课程,它有一个很好的SVM实现。这是4或5年前。

2

Pentaho是一个商业智能的好套装。所以也许你想看看它。我有一些经验,主要用于数据仓库,并且非常开心。

+0

似乎Pentaho是Weka的主要赞助商:http://weka.sf.net – 2008-10-28 13:59:15

+0

不知道。也许我必须重新查看Weka。 – 2008-10-28 14:47:17

5

另一种选择是Orange。它包括各种算法和数据挖掘技术,您可以直接通过Python脚本或通过GUI访问这些技术。

2

直接在R中重新发明车轮和代码!

0

如前所述,Pentaho是WEKA所属的强大商业智能套件。

因此,我还建议Weka,只是为了您有一个很好的解决方案来扩展您的应用程序和一个伟大的社区。

1

KNIME)是相当广泛的数据挖掘平台。

2

如果您有兴趣与频繁模式挖掘一些的Java代码,协会规则和序列模式挖掘,我有一个小的开源项目,有42个算法涉及到这些主题:http://www.philippe-fournier-viger.com/spmf/

但是,请注意它不提供任何用户界面。但它提供了一些非常专业的算法,这些算法在其他数据挖掘软件包中找不到。

1

看看ELKI,这与WEKA相似,除了它在聚类和异常值检测方面更强大,而WEKA基本上只对分类很好。