2013-12-21 25 views
0

我对如何搜索漫游器将抓取我的ajax站点有点困惑。Hashbang,prereder.io和机器人

http://www.example.com包含3个环节

  • #!/ ABC
  • #!/ XYZ
  • #!/ 123

我已经包含在我的网页的头,使<meta name="fragment" content="!">机器人应使用以下URL访问这些链接,并使用prerender.io提供页面

当他们抓取这些网页将如何表现的机器人?当他们在这些网页上发现新链接时,url的外观如何? !

  1. #/ ABC1 =>http://www.example.com?_escaped_fragment_=/abc#!/abc1
  2. #/ ABC2 =>http://www.example.com/#!/abc/abc2

回答

2

下面是谷歌的全AJAX抓取规格:https://developers.google.com/webmasters/ajax-crawling/docs/specification

机器人将看到#!和改造他们成为_escaped_fragment_网址,就像您提到的那样。 <meta name="fragment" content="!">标签仅适用于没有#!的网页,例如您的主页或任何HTML5推送状态网址。如果URL有#!,谷歌会自动询问为_escaped_fragment_不检查<meta name="fragment" content="!">

如果谷歌抓取http://example.com?_escaped_fragment_=/abc,发现页面上的链接为/#!/xyz,它会让一个独立的请求http://example.com?_escaped_fragment_=/xyz

因此,您应该始终将您的网址链接到#!网址,而不要链接到_escaped_fragment_网址。谷歌将自行改造它们。