阅读Nutch从MySQL中检索数据

我编写了一个程序来在MySQL中存储nutch（2.1）检索结果。它工作正常。我得到了为搜索指定的文件格式。我收到几个jpeg文件。我想从DB中获取这些图像（我不确定它们是否被存储）。我有一个图片网址字段。我可以去那里取。但是，nutch在MySQL中如何存储这么多的数据呢？你能帮我解决吗？
我使用下面的代码：阅读Nutch从MySQL中检索数据

String crawlArg = "urls -threads 5"; 

    // Run Crawl tool 

    try { 
      ToolRunner.run(NutchConfiguration.create(), new org.apache.nutch.crawl.Crawler(), 
          tokenize(crawlArg)); 
    } catch (Exception e) { 
      e.printStackTrace(); 
      return; 
    }

请问任何你可能需要更多的细节。我是nutch的新手。

来源

2013-02-20 Ravi Singh

我错过了内容字段MySQL这是LongBlob并存储图像。

来源

2013-02-20 17:19:35

你能否给我推荐一个很好的教程来阅读使用java抓取的页面。 – muthu 2013-05-09 07:16:15

我在问什么是我需要阅读使用java代码crawleddb – muthu 2013-05-09 08:28:24

可以分享您的代码“将数据保存到mysql” – muthu 2013-05-09 09:48:55

阅读Nutch从MySQL中检索数据

回答

相关问题