2
如果Nutch已经在索引中,它会再次索引页面吗?如果是这样,我该如何改变这一点?Nutch,蜘蛛,索引网页它已经在它的索引?
如果Nutch已经在索引中,它会再次索引页面吗?如果是这样,我该如何改变这一点?Nutch,蜘蛛,索引网页它已经在它的索引?
是的,没有。默认情况下,Nutch只会在一段时间后(从内存中)重新索引页面,如果页面没有改变,它会延迟增加重新索引时间,默认最多为3个月。 所有设置均可在nutch-site.xml中配置