googlebot

4热度

1回答

是否有可能找到当谷歌机器人抓取我的网站上的任何网址，并记录上一次访问时间到服务器上的文本文件

下面的代码发送电子邮件，当任何网页被谷歌抓取并导致垃圾邮件的邮箱。所以有可能在服务器上的文本文件中记录上次爬行的时间戳，随后我可以使用perl LWP mod随时读取它。文件应该只是这样的数据：29，2012年1月GMT等如果机器人正在访问我的网站多次，那么它应该覆盖的txt文件，并只记录最后访问时间，请了一些实施如果可能的话帮 <?php if (strpos($_SERVER['HTTP

1热度

1回答

的Googlebot如何解释我的网址

我有一个关于如何在谷歌爬虫（Googlebot）也将在这种情况下做题： http://www.url.com?query=something#!somethingelse 将其改为： http://www.url.com?query=something?_escaped_fragment_=somethingelse 或 http://www.url.com?query=something&_es

4热度

1回答

当Googlebot请求“？_escaped_fragment_ =”URL时，Googlebot如何知道网络服务器没有隐形？

关于谷歌的AJAX抓取规范，如果服务器为#! URL和一些其他（即页的“HTML快照”），以Googlebot的返回一个件事（即，一个JavaScript重文件）当#!被替换为?_escaped_fragment_=，那感觉就像隐藏给我。毕竟，Googlebot如何确保服务器返回#!和?_escaped_fragment_=网址的诚信等价物。但这正是AJAX爬行规范实际上告诉网站管理员要做的事情。

0热度

1回答

从重复的网站中删除包含链接

有一个重复的开发网站，因为遗留原因存在并且正在等待完全删除，它始终有一条规则来保留所有搜索引擎的robots.txt文件，但是在某一时刻，机器人.txt被意外删除，并且在某个时间点，有两个跨域重复项目，并且Google将整个重复网站编入索引，并且导致数千个到生产网站的传入链接出现在Google网站站长工具中（您的站点位于网站>链接到您的网站）。 robots.txt得到恢复，整个开发站点受密码保护

2热度

1回答

Google bot ajax索引当前状态

Google bot索引ajax网站的当前状态是什么？我有链接显示一些列表：&富=酒吧内容是刚刚页面加载后动态加载的jQuery mysite.com/list#key=value： $(document).ready(function() { // load content to div by $.ajax() request }); 难道谷歌抓取其并得到加载的内容或做我必须做

0热度

2回答

Googlebots和会话

我有一个网站的部分设置会话变量。在网站的另一部分，如果设置了该变量，则将其重定向到设置该变量的网站部分的位置。 <?php //page1: session_start(); $_SESSION['pg1']=true; //page2 if ($_SESSION['pg1']===true) { header('Location: http://www.mysit

3热度

2回答

怎么把HTML快照放到SEO的hash-bang URL？

我用我的AJAX应用程序的哈希爆炸的网址，我实现服务器端为：？手柄_escaped_fragment_ =键1 =值％26key2 =数值所以，当我看在Google的FAQ中，它表示this URL有一个equivalent snapshot 很容易看出快照内容与相应的散列链接url不同。这个Google示例没有帮助，因此我的问题是：我的HTML页面有三个由AJAX更新的组件/面板/部分。我

2热度

1回答

Googlebot可以绕过reCAPTCHA的验证吗？

Googlebot可以在自己的reCAPTCHA系统上绕过验证，以便我可以将它放到我的网站上，而不会阻止Google将其编入索引？

2热度

1回答

PHP脚本检测浏览器语言，谷歌机器人怎么样？

我正在使用两种语言（英语和法语）可用的网站。我制作了一个脚本，用$ _SERVER ['HTTP_ACCEPT_LANGUAGE']检测浏览器语言，并根据结果加载一个xml文件，其中写入所有文本。我想知道这是否是一个搜索引擎优化问题，因为我猜测谷歌机器人会得到英文版本，但不是法文？谢谢

0热度

2回答

htaccess问题：标题投掷404虽然页面正确显示

我目前面临一个很奇怪的问题，我在单个域名上安装了wordpress和oscommerce。我把wordpress放在/ store /文件夹的根目录和oscommerce中。除了一件事以外，一切正常。虽然页面显示正确，但oscommerce的服务器标题正在抛出404错误。这会导致Googlebot根本无法索引这些网页。有人可以帮我解决这个问题吗？我现在应该怎么做？ Root httaccess