2009-10-28 118 views

回答

1

您可以使用Google Robots tool进行结账。我永远不会在机器人文件中放置任何秘密目录,因为我猜想像下面这样的一行对于某些蜘蛛来说就像是亲爱的。

Disallow: /secret 
2

尝试更换的顺序不允许/允许:

User-agent: * 
Allow: /index.php 
Disallow:/

参见维基百科这样的信息:

“然而,在秩序,是所有 机器人兼容,如果你想要允许在不允许的 目录中存在单个 文件,则需要先放置允许 指令,然后再放置 不允许,例如:”

http://en.wikipedia.org/wiki/Robots.txt

不过我不希望它太一致

19

是,它将携手。以下是Google Webmaster Tool的测试结果。

Url 
http://www.example.org/index.php 

Googlebot 
Allowed by line 3: Allow: /index.php 

Googlebot-Mobile 
Allowed by line 3: Allow: /index.php 

但是,请记住,使用此配置,除非使用完全限定路径访问页面,否则您的网站主页将不会被抓取。 换句话说,http://www.example.org/被禁止,而http://www.example.org/index.php被允许。

如果您希望您的主页可以访问,请提供更好的文件版本。

User-agent: * 
Disallow:/
Allow: /index.php 
Allow: /$ 
+1

你能解释为什么/ $工作,或者它做了什么? – 2015-03-03 01:48:07

+0

可以找到'/ $'的解释[here](http://stackoverflow.com/a/29475539/1973409) – 2016-12-17 20:27:48

3
User-agent: * 

Allow: /index.php 
Disallow:/
1
User-agent: * 
Allow: /$ 
Allow: /index.php 
Allow: /sitemap.xml 
Allow: /robots.txt 
Disallow:/

Sitemap: http://www.your-site-name.com/sitemap.xml 
+3

你能解释一下你的答案吗? – Qix 2014-08-04 01:12:36

相关问题