除了Mahout之外,还有哪些其他框架用于在JAVA中实现机器学习算法,使底层框架采用JAVA代码并在Hadoop上运行它?使用Hadoop的机器学习框架
我寻找替代亨利马乌因为我需要一个SVM和Hadoop的一个聚集集簇实现的,只有SVM在Mahout的支持。
除了Mahout之外,还有哪些其他框架用于在JAVA中实现机器学习算法,使底层框架采用JAVA代码并在Hadoop上运行它?使用Hadoop的机器学习框架
我寻找替代亨利马乌因为我需要一个SVM和Hadoop的一个聚集集簇实现的,只有SVM在Mahout的支持。
快速谷歌搜索提供了以下
http://java-ml.sourceforge.net/ - 经过近3年,有一个释放。不知道它的支持程度以及执行哪些算法。
http://sourceforge.net/projects/weka/ - 最近被他人的一些建议看起来不错。
此外,请参阅此thread。
没有尝试过他们两人。
我不相信他们在hadoop本身运行。或者他们呢? – 2012-07-12 09:57:50
这些不是与Hadoop相关的。韦卡虽然很成熟。 – 2012-07-12 10:58:48
是的,对不起,我错过了Hadoop的一部分。 – 2012-07-12 11:50:58
我建议你如Apache Mahout中的Apache Hadoop的基于机器学习/数据挖掘库家伙这个链接有用。
http://www.openankus.org/pages/viewpage.action?pageId=2195722
它是如此简单和容易的MapReduce作业处理。你有兴趣吗?查看更多维基(http://www.openankus.org)
那么,如果SVM是在Hadoop上,剩下的就是容易实现!
注意,幼稚凝聚聚类算法是没有效率的大数据(O(N^2)的复杂性)。这种复杂性使得它无法在大型数据集即使在一个大的集群中运行的算法,除非你试试它的扩展的一个像这样的:ftp://193.167.42.127/franti/papers/GraphPnn-TPAMI.pdf
模式。它有一个Java API,你也可以使用R.
在hadoop上本机运行并且可靠/稳定/成熟/无论什么?没有我知道的。你能否说Mahout有什么问题,你正在寻找替代品?这将使回答这个问题变得更容易。 – 2012-07-12 09:59:07
我创建了Mahout的非分布式Mahout推荐器,以及部分基于Hadoop的推荐器。我目前正在开发基于Mahout的下一代系统,名为Myrrix(http://myrrix.com),其中包含基于Hadoop的推荐器实现。不知道它是你想要的,但如果你对Hadoop + Mahout感兴趣,那么它是相关的。 – 2012-07-12 10:58:01