2016-09-07 65 views
2

我刚刚按照教程从NutchWiki设置Nutch。bin/nutch注入抓取/ crawldb网址不起作用

下载Nutch 2.x src并设置所有配置。 当我刚刚开始爬网时发生问题。 当我运行这段代码时:bin/nutch inject crawl/crawldb urls我收到了这样的错误消息:Unrecognized arg urls 我只是按照教程中的所有步骤,创建了目录,对配置文件等进行了更改。而且我还有一个查询,没有crawldb目录在apache-nutch-2.x/runtime/local /它是自动生成还是需要手动生成它? 任何帮助这个问题将不胜感激。

回答

4

我正在经历同样的问题。文件似乎已过时。它用于1.x。

对于2.x我已经尝试了以下,它为我工作。

bin/nutch inject urls 

希望它能帮助。

+0

yippiee !!!工作。谢谢。 :) – Abhishek