2009-06-11 128 views
2

为了样式的目的,我想在页面上插入一些虚拟文本,但它不应该链接到实际内容。有没有办法阻止它的搜索引擎,还是我不得不使用良好的旧图像呢?阻止某些html元素被搜索引擎索引

或者它有可能通过JavaScript动态加载它?因为我听说谷歌会阅读一定数量的JavaScript。

+1

即使您屏蔽了行为良好的搜索引擎,请注意恶意的可能会忽略或规避您放入的安全 – 2009-06-11 14:51:33

回答

0

我会非常小心,无论你决定什么技巧。赔率是谷歌可能认为你试图向用户展示不同内容的可能性。

我一直认为Google实际上是通过渲染页面(可能使用某些服务器端版本的Chrome渲染引擎)来工作的,然后使用OCR软件读取结果以确认源文本与用户会看到JS和框架启用。谷歌一直公开警告网站管理员不要尝试向用户提供不同内容的机器人,而OCR将是找出问题的最佳方式(特别是如果您的'验证者'使用IE的用户代理字符串并从未经Google注册的IP范围内抓取)。

简短的回答那么,服务于装饰为两种:

  • 一个iframe
  • 对象
  • SVG图像

由于您的文件中明确链接到您的网页谷歌会可以认为它是一个单独的资源,并相应地对事物进行评分,特别是如果每​​个页面上都显示相同的文本。这给我带来了:

你打算在所有/大多数页面上使用相同的文字装饰吗?如果是这样的话,谷歌几乎肯定会把它当作“橱窗”并忽略它(它显然是通过菜单等来实现的)。

+0

Google当然不会使用OCR来阅读页面。这太荒谬了。 – 2009-07-15 09:15:14

1

你可以在无边框iframe中显示内容,并阻止iframe的src(一个完全独立的“页面”)从搜索引擎?

或者,使用javascript添加内容,将JavaScript存储在您从引擎中阻止的.js文件中?

0

我猜想在页面加载完成后(例如document.ready事件触发时)加载内容将是一种相当安全的方式来完成您正在谈论的内容。虽然不是100%确定的。

1

如果你通过AJAX加载文本,它可能不会被编入索引 - 上次我检查时,GoogleBot并没有真正执行JS(也没有其他的蜘蛛(但有些spambots显然可以))。

注意:AJAX响应可能应该包含一个X-Robots-Tag: noindex标头,以防其URL实际链接到某处。