2013-05-13 89 views
1

我遵循Apache Nutch Wiki中的每一步。我使用的是MacOSX 10.8.3,我的JAVA_HOME已经完美设置,当bin/nutch执行时(甚至根据wiki),甚至可以看到各种命令选项。Apache Nutch命令无法执行

但是当我使用bin/nutch crawl urls -dir crawl -depth 3 -topN 5,我得到以下错误:

bin/nutch: line 104: [: too many arguments 
Error: Could not find or load main class Engines 

FYI:我已经创建了一个urls目录apache-nutch-1.6/urls

任何一个可以告诉可能是什么问题?

+0

你可以说你的命令在其文件路径('的命令pwd'响应)上运行? – cguzel 2013-05-14 12:00:19

回答

0

你可以尝试如下:

首先,通过建立蚂蚁的Nutch。

cd nutch-1.x.x/runtime/local/

mkdir urls(种子名单目录)

mkdir crawl(为​​选项)

vim urls/seed,然后添加一个或多个网址(例如:http://www.examplesite.com

bin/nutch crawl urls - 或 - bin/nutch crawl urls -dir crawl -depth 3 -topN 5

0

经过一番研究,我发现我忘了设置NUTCH_JAVA_HOME。 下面是步骤:

set NUTCH_JAVA_HOME=/System/Library/Frameworks/JavaVM.framework/Versions/1.6/Home 
export NUTCH_JAVA_HOME 

是的,我重新设置JAVA_HOME还有:

set JAVA_HOME=/System/Library/Frameworks/JavaVM.framework/Versions/1.6/Home 
export JAVA_HOME