2013-02-20 104 views
1

我编写了一个程序来在MySQL中存储nutch(2.1)检索结果。它工作正常。我得到了为搜索指定的文件格式。我收到几个jpeg文件。我想从DB中获取这些图像(我不确定它们是否被存储)。我有一个图片网址字段。我可以去那里取。但是,nutch在MySQL中如何存储这么多的数据呢?你能帮我解决吗?
我使用下面的代码:阅读Nutch从MySQL中检索数据

String crawlArg = "urls -threads 5"; 

    // Run Crawl tool 

    try { 
      ToolRunner.run(NutchConfiguration.create(), new org.apache.nutch.crawl.Crawler(), 
          tokenize(crawlArg)); 
    } catch (Exception e) { 
      e.printStackTrace(); 
      return; 
    } 

请问任何你可能需要更多的细节。我是nutch的新手。

回答

0

我错过了内容字段MySQL这是LongBlob并存储图像。

+0

你能否给我推荐一个很好的教程来阅读使用java抓取的页面。 – muthu 2013-05-09 07:16:15

+0

我在问什么是我需要阅读使用java代码crawleddb – muthu 2013-05-09 08:28:24

+0

可以分享您的代码“将数据保存到mysql” – muthu 2013-05-09 09:48:55