我正在使用robots.txt
文件来防止抓取工具抓取特定页面。当我想防止爬行在myfolder
一切/folder/myfolder/
我可以把robots.txt
在/folder/myfolder/robots.txt
写:放置robots.txt以防止抓取的位置
User-agent: *
Disallow:/
否则我将不得不把robots.txt
在/robots.txt
,并设置:
User-agent: *
Disallow: /folder/myfolder/
谁知道?
可能重复的[robots.txt允许所有除了少数子目录](http://stackoverflow.com/questions/28495972/robots-txt-allow-all-except-few-sub-directories) – unor