0
我是java.I中的新成员想让一个简单的web crawler.how访问robots.txt文件中的一个网站在java.actually我不太了解robots.txt。 plz帮助我。在java中访问robots.txt文件
我是java.I中的新成员想让一个简单的web crawler.how访问robots.txt文件中的一个网站在java.actually我不太了解robots.txt。 plz帮助我。在java中访问robots.txt文件
您需要解决两个任务:
你到目前为止尝试过什么? – 2012-04-10 23:39:38
robots.txt文件位于每个网站上相当标准的位置(因为任何给定数量的各种搜索引擎都需要能够找到它)。访问它就像获得[url] /robots.txt一样简单;) – 2012-04-10 23:45:37