2015-09-17 12 views
0

elasticsearch整合我想用亨利马乌做存储在elasticsearch找到类似文件或建议基础上已经标记与某些条件的记录等记录数据的一些预测分析。与象夫

我计划建立一个象夫集群,但是确实elasticsearch有Hadoop集群内坐下来提供此功能?我需要运行es-hadoop吗?或者有没有另一种方法让Mahout在elasticsearch中查看数据?

与刚才的elasticsearch相比,es-hadooop会对速度产生什么影响吗?

回答

0

亨利马乌不需要安装在同一个机器作为Elasticsearch却可以。新亨利马乌具有基于Hadoop的MapReduce的,但这些最终将有利于新的Spark实现,这已在自亨利马乌0.10.0的代码被废弃行和项目相似的遗留实现,它现在是在0.11.0

在PredictionIO的Universal Recommender中,Mahout的Spark代码与Elasticsearch有完整的推荐器集成。见文档的象夫和PIO这里: http://mahout.apache.org/users/algorithms/intro-cooccurrence-spark.html https://github.com/PredictionIO/template-scala-parallel-universal-recommendation

至于使用Elasticsearch的ES-hadooop,通用导购用的是星火的实施,我会说这是最好这样做,因为它是分布式计算优化。但是没有要求使用它。