2012-04-12 141 views
0

我正在寻找一种Java库,它不仅可以使用ID3或C4.5算法构建决策树,还可以以某种合适的格式存储新构建的树。问题在于,我计划使用决策树引擎作为某种用户需求推理系统,即在使用培训数据生成决策树之后,我想给它输入(来自用户的数据)并将输出用作对用户的推荐。简单地说,我只是不能遍历生成的树并根据输入数据集来获取结果。我还希望不仅构建二元决策树,还要为每个父节点构建具有可变数量子元素的树(这意味着某些节点可能有两个子元素,其中三个元素都根据父节点中检查的属性值)。我刚开始使用决策树,并没有太多的经验。我用谷歌搜索,开始看WEKA,但我不确定它是否满足我的要求。任何指导都会有很大的帮助。提前致谢!用于生成和使用生成的决策树的Java库

回答

0

与weka一起,这是流行的,高性能的,稳定的,有据可查的,人们将能够帮助你。

1

Weka是最先进的分类工具,包括C4.5。肯定地尝试一下。实际上,许多其他工具(KNIME,Rapidminer)通常会围绕Weka进行,主要是做一些数据预处理,用户界面,实验运行等,但主要任务是委托给Weka。

在我看来,Weka并不是完全为此设计的,但它是分类和预测的参考实现。 所以试试吧!当您正在查看其他任务(如聚类或异常检测)时,请使用其他工具(如ELKI)代替。 Wekas聚类算法很少。

+0

我会definitelly试一试。但是你提到,在你的意见中,WEKA并不是完全为此设计的。在这种情况下,哪个库更适合使用? – ferbolg 2012-04-13 20:20:26

+0

我不知道周围是否有更好的东西。每个人似乎都使用Weka或GNU R进行分类。 – 2012-04-14 05:57:23

+0

还有其他商业软件包可用。统计是一个。有趣的是,Weka和R都必须在他们的CART决策树实现中进行折衷,因为描述CART算法的书保留了算法的一部分秘密。它描述了一个很难解决的算法(如时间),然后说他们实现的实际算法不是这个算法。不是你必须知道的东西,而R和Weka算法在不知道它的情况下表现得足够好。但是,只是一些有趣的琐事。 – chubbsondubs 2012-04-25 17:44:59