2016-06-14 105 views
0

我正在寻找使用WEKA来训练和预测MongoDB中的数据。具体来说,我打算使用Weka API分析数据(例如构建推荐引擎)。但我不知道如何继续,因为MongoDB中的数据以BSON格式存储,而WEKA使用ARFF格式。我想使用WEKA API从MongoDB读取数据,进行分析,并向用户提供实时推荐。我无法在WEKA和MongoDB之间找到桥梁。如何使Weka API与MongoDB一起使用?

这是甚至可能或者我应该尝试另一种方法?

+0

此链接显示了一个以编程方式定义自己的.arff文件的好例子。 https://weka.wikispaces.com/Programmatic+Use – Walter

+0

您是否考虑过使用mongodb jdbc或odbc驱动程序从weka访问MongoDB数据? – user6641561

回答

0

在开始之前,我应该说WEKA并不是处理大数据的最佳工具。如果您确实拥有大数据,您可能会希望使用Spark和Hadoop系列,因为它们更适合分析。

要回答你写的问题,我会建议手动进行培训(即使用任何可用的编程工具创建培训文件)并预训练模型。这些模型可以保存并相应地集成到一个程序中。

要进行测试,您可以按照official instructions进行测试,但我通常会采用一些快捷方式:我通常会将数据预处理为类似CSV的格式(就好像它正在进入ARFF文件一样) ARFF标题(与培训文件使用的标题相同)。从那里开始,测试实例非常简单。根据我的经验,这极大地简化了编写实际进行新颖预测的代码的过程。

+0

非常感谢您的帮助!我想像你的想法一样使用Weka。但我会努力学习Spark!如果是更好的选择,我会把它带入我的项目! 非常感谢! :) – Duong

相关问题