-1
我有一些特定的URL(约17000网址),我想运行Apache的Nutch永远即爬,当它完成了所有步骤,那么它应该重新开始自动如何让Apache Nutch的抓取永远
我有一些特定的URL(约17000网址),我想运行Apache的Nutch永远即爬,当它完成了所有步骤,那么它应该重新开始自动如何让Apache Nutch的抓取永远
什么脚本文件中的一个简单的while循环?
for ((; ;))
do
#set variables
bin/nutch crawl $URLS -dir $CRAWL_LOC -depth 1 -topN 1000
done
// Linux的脚本
我有这样的想法在我的脑海里,但我想了解一些标志等,应只设置改变原始脚本的insetead – Shafiq 2014-11-10 03:55:49
写一个单独的脚本,在for循环调用当前脚本 – 2014-11-10 04:18:06