2014-09-23 47 views
1

我用solr正确设置了nutch 1.9。现在我想通过java将这些数据检索到一个程序中,以分析和显示数据。在他们那一刻,我可以用solr查询数据。但是,我无法找到关于nutch使用的底层数据库以及如何检索数据的更多信息。Apache nutch 1.9数据库

任何建议,如何做到这一点?

我很感谢您的回答!

回答

0

如果你可以看到你的数据已经索引在Solr中,那么你不需要从Nutch中获取任何东西。您现在需要的是正确的Solr客户端与Solr进行交互。客户端将查询Solr并解析响应。

既然你要使用Java,你应该使用SolrJ

+0

也可以直接连接到nutch数据库吗?有没有像jdbc连接? – mrquad 2014-09-24 13:16:23

+2

如果你想直接连接到Nutch,那么你应该使用Nutch 2.x版本。它使用数据库(MySql,HBase,Cassandra)作为存储引擎。因此,您可以查询这些数据库并获取Nutch原始数据。但是,您为什么要访问原始数据?我在这里很car。。 – ameertawfik 2014-09-24 14:00:43

+0

Thx为您的答案!我想解析html来检索一些特定的字段,我想这是存储在nutch中,还是我错了? – mrquad 2014-09-24 19:09:57