1
我编写了一个程序来在MySQL中存储nutch(2.1)检索结果。它工作正常。我得到了为搜索指定的文件格式。我收到几个jpeg
文件。我想从DB中获取这些图像(我不确定它们是否被存储)。我有一个图片网址字段。我可以去那里取。但是,nutch在MySQL中如何存储这么多的数据呢?你能帮我解决吗?
我使用下面的代码:阅读Nutch从MySQL中检索数据
String crawlArg = "urls -threads 5";
// Run Crawl tool
try {
ToolRunner.run(NutchConfiguration.create(), new org.apache.nutch.crawl.Crawler(),
tokenize(crawlArg));
} catch (Exception e) {
e.printStackTrace();
return;
}
请问任何你可能需要更多的细节。我是nutch的新手。
你能否给我推荐一个很好的教程来阅读使用java抓取的页面。 – muthu 2013-05-09 07:16:15
我在问什么是我需要阅读使用java代码crawleddb – muthu 2013-05-09 08:28:24
可以分享您的代码“将数据保存到mysql” – muthu 2013-05-09 09:48:55