googlebot

    4热度

    1回答

    下面的代码发送电子邮件,当任何网页被谷歌抓取并导致垃圾邮件的邮箱。所以有可能在服务器上的文本文件中记录上次爬行的时间戳,随后我可以使用perl LWP mod随时读取它。 文件应该只是这样的数据:29,2012年1月GMT等 如果机器人正在访问我的网站多次,那么它应该覆盖的txt文件,并只记录最后访问时间,请了一些实施如果可能的话帮 <?php if (strpos($_SERVER['HTTP

    1热度

    1回答

    我有一个关于如何在谷歌爬虫(Googlebot)也将在这种情况下做题: http://www.url.com?query=something#!somethingelse 将其改为: http://www.url.com?query=something?_escaped_fragment_=somethingelse 或 http://www.url.com?query=something&_es

    4热度

    1回答

    关于谷歌的AJAX抓取规范,如果服务器为#! URL和一些其他(即页的“HTML快照”),以Googlebot的返回一个件事(即,一个JavaScript重文件)当#!被替换为?_escaped_fragment_=,那感觉就像隐藏给我。毕竟,Googlebot如何确保服务器返回#!和?_escaped_fragment_=网址的诚信等价物。但这正是AJAX爬行规范实际上告诉网站管理员要做的事情。

    0热度

    1回答

    有一个重复的开发网站,因为遗留原因存在并且正在等待完全删除,它始终有一条规则来保留所有搜索引擎的robots.txt文件,但是在某一时刻,机器人.txt被意外删除,并且在某个时间点,有两个跨域重复项目,并且Google将整个重复网站编入索引,并且导致数千个到生产网站的传入链接出现在Google网站站长工具中(您的站点位于网站>链接到您的网站)。 robots.txt得到恢复,整个开发站点受密码保护

    2热度

    1回答

    Google bot索引ajax网站的当前状态是什么?我有链接显示一些列表:&富=酒吧 内容是刚刚页面加载后动态加载的jQuery mysite.com/list#key=value: $(document).ready(function() { // load content to div by $.ajax() request }); 难道谷歌抓取其并得到加载的内容或做我必须做

    0热度

    2回答

    我有一个网站的部分设置会话变量。在网站的另一部分,如果设置了该变量,则将其重定向到设置该变量的网站部分的位置。 <?php //page1: session_start(); $_SESSION['pg1']=true; //page2 if ($_SESSION['pg1']===true) { header('Location: http://www.mysit

    3热度

    2回答

    我用我的AJAX应用程序的哈希爆炸的网址,我实现服务器端为:? 手柄_escaped_fragment_ =键1 =值%26key2 =数值 所以,当我看在Google的FAQ中,它表示this URL有一个equivalent snapshot 很容易看出快照内容与相应的散列链接url不同。这个Google示例没有帮助,因此我的问题是: 我的HTML页面有三个由AJAX更新的组件/面板/部分。我

    2热度

    1回答

    Googlebot可以在自己的reCAPTCHA系统上绕过验证,以便我可以将它放到我的网站上,而不会阻止Google将其编入索引?

    2热度

    1回答

    我正在使用两种语言(英语和法语)可用的网站。我制作了一个脚本,用$ _SERVER ['HTTP_ACCEPT_LANGUAGE']检测浏览器语言,并根据结果加载一个xml文件,其中写入所有文本。 我想知道这是否是一个搜索引擎优化问题,因为我猜测谷歌机器人会得到英文版本,但不是法文? 谢谢

    0热度

    2回答

    我目前面临一个很奇怪的问题,我在单个域名上安装了wordpress和oscommerce。我把wordpress放在/ store /文件夹的根目录和oscommerce中。 除了一件事以外,一切正常。虽然页面显示正确,但oscommerce的服务器标题正在抛出404错误。这会导致Googlebot根本无法索引这些网页。 有人可以帮我解决这个问题吗?我现在应该怎么做? Root httaccess