2012-04-02 35 views
3

我有一个页面,是如此JavaScript密集我甚至不能开始写它的等效PHP。在这种情况下,该页面有一个<noscript>标签,表明该页面对非js用户不可查看。无脚本谷歌快照,安全的方式

无论如何,我可以提供页面的快照版本,以便Google可以查看页面包含的内容,以便人们可以通过搜索词组来找到我的页面。

那么,我有没有办法让我的蛋糕也吃了呢?意思是我可以为非js用户提供一个空白页面,但是如果谷歌机器人出现,它将成为一个框架页面?

我怎么会这样做呢?也会做这样的事情会伤害我的排名吗?

回答

4

值得一提的是,Googlebot已知可以执行大量的Javascript。只要加载的页面上有所有必要的内容,你可能会很好(对于谷歌来说 - 至少对于其他搜索引擎来说,可能不那么重要)。

不及格:您不一定需要在页面的无脚本版本中拥有所有相同的内容,只是试图传达相同类型的信息。我不知道您的网站涉及什么,但是如果您只需转储页面内容的基本文本表示形式,那可能就足够了。

+0

我还确保导航建议也是在无脚本版本.. – 2012-11-28 09:31:35

2

您可以在其中使用与Googlebot不同的用户代理,但这样做风险很大,因为Google可以将其检测为试图欺骗他们的机器人。

0

只是为了让你知道:Google policy on serving different content based on user info.

伪装是指显示不同的内容或 网址,用户和搜索引擎的做法。在用户代理上提供基于 的不同结果可能会导致您的网站被视为具有欺骗性,并且将其从Google索引中删除。

伪装的一些例子包括:

Serving a page of HTML text to search engines, while showing a page of images or Flash to users. 
Serving different content to search engines than to users. 

如果您的网站包含不被搜索引擎抓取 (如富媒体比的Flash,JavaScript或图像文件等)的元素, 你不该不会向搜索引擎提供隐形内容。相反,您 应该考虑到您的网站的访问者也无法查看这些 元素。例如:

Provide alt text that describes images for visitors with screen readers or images turned off in their browsers. 
Provide the textual contents of JavaScript in a noscript tag. 

确保您提供在两个元素中的内容相同(例如 ,提供在JavaScript相同的文字作为非脚本 标签)。在备用内容中包含实质上不同的内容可能会导致Google对该网站采取行动。欺骗性JavaScript重定向

当Googlebot的索引包含JavaScript的网页,它会指数 该网页,但它可能不符合或索引隐藏在 的JavaScript本身的任何链接。使用JavaScript是完全合法的网络练习。但是,使用JavaScript的目的是欺骗搜索引擎 不是。例如,放置不同的文字在JavaScript 比在非脚本标记违反了我们的网站管理员指南,因为它 显示不同的内容,为用户(谁看到基于JavaScript的 文字)和搜索引擎(看到的基于非脚本标记的文字)。 沿着这些路线,它违反了网站管理员指南,在JavaScript中嵌入了一个 链接,该链接将用户重定向到不同的页面,其目的是向用户显示与搜索引擎 不同的页面。当JavaScript中嵌入重定向链接时,搜索 引擎会将原始页面编入索引,而不是链接后面的链接,而用户将转到重定向目标。伪装一样,这 行为也具有欺骗性,因为它会显示不同的内容给用户 和Googlebot,并可以采取地方比这里 他们打算去其他访客。

请注意,在JavaScript中放置链接本身并不具有欺骗性。 检查您网站上的JavaScript以确保您的网站符合我们的指南 时,请考虑其意图。

请记住,由于搜索引擎通常无法访问Javascript的 内容,在JavaScript中的合法链接可能会 无法访问他们(以及对游客不 使用Javascript功能的浏览器)。您可能会将链接保留在 JavaScript之外或将其复制到noscript标记中。门口页面

门口页面通常是大量低质量页面,其中每个页面都针对特定关键字或短语进行了优化。在许多 的情况下,门口页面被编写为对特定短语进行排名,然后将用户汇集到单个目的地。

无论是在多个域中部署还是在一个域中建立, 门页都倾向于阻止用户,并且违反了我们的网站管理员指南 。

谷歌的目的是给我们的用户最有价值的相关 搜索结果。因此,我们不赞成,旨在 操纵搜索引擎,并通过他们引导到网站 以外,他们选择了那些欺骗用户的做法,而仅仅是为了 搜索引擎的利益提供内容。谷歌可能会对门户网站 和其他使用这些欺骗性做法的网站采取行动,其中包括 从Google索引中删除这些网站。

如果您的网站已经从搜索结果中移除,请参阅 网站管理员指南以获取更多信息。一旦您对 进行更改并确信您的网站不再违反我们的 准则,请提交您的网站以供重新审查。

0

我正在处理与网站类似的问题,并且有一种方法可以提供页面的HTML快照。你可以在Google Developers上找到它:

https://developers.google.com/webmasters/ajax-crawling/docs/getting-started 本页面最后更新于2012年2月。

还有在内容,这是一个更快的解决方案,但它确实有由谷歌被视为企图歪曲排名的可能性的前面加一个脚本标记中的选项。从我所做的研究中,人们在2008 - 2010年左右发布了这种类型的标签作为解决方案。

虽然Googlebot就可以执行一些JavaScript,这是,谷歌正在努力改进的东西,它不说,它正在执行网站上的所有的JavaScript。从我在网上找到的信息来看,Google只在网站上经历最严重的网页上执行Javascript。我仍然建议提供HTML快照,但我不喜欢它。

它可以检查Apache日志,看看谷歌的网页上执行JavaScript。

http://arstechnica.com/information-technology/2012/05/googles-bots-learn-to-read-interactive-web-pages-more-like-humans/