未被Google索引的页面

据我所知，我的公司已在我们的网站上运行Google搜索。我开发了一个文档系统，也正在被Google索引。系统中的页面是动态生成的，因此我有www.mysite.com/doc.aspx?id=234，www.mysite.com/doc.aspx?id=236等索引。事情是，一些随机页面（比如www.mysite.com/doc.aspx?id=235）未被索引，原因不明。我希望在哪里解决这个问题？有任何想法吗？未被Google索引的页面

来源

2011-04-04 netNewbi3

这里是谷歌如何处理您的网站（）

discovery -> crawling -> indexing -> ranking (->feedback)

发现短，很simpliefied概要：是谷歌发现你的网站（S）的网页的过程中，这样可以既可以通过HTML或通过一个sitemap.xml的链接完成（在JavaScript的的onpage，RSS或Atom和URL饲料，...基本上任何URL谷歌能找到一些）

爬行：的谷歌抓取过程Ť他内容的发现URL的（和推新发现的网址进入发现队列）

索引：存储发现并检索内容到他们的数据库，并使其可搜索

排名：匹配通过用户查询索引内容并 - 如果足够重要 - 将其作为可见的SERP列表返回给用户。基于点击

反馈 /不点击行为，并从其他渠道（假定ISDN数据和谷歌工具栏，chrome浏览器报告，...），谷歌收集反馈收集有关用户行为上它的SERP数据（并在点击后）。

每一步之间的质量指标（最后一步就是只是一个质量指标收集步骤）的很多。
每一步都会报告回之前的步骤。

因此，基本上即使您将所有的网址传送到谷歌（即通过sitemap.xml），谷歌也不一定会抓取您的所有网址或索引或将它们排序为可见。

好的，那么低挂果实能够获得更多的页面进入索引（他们至少有机会排名）？

沟通每页只有一个URL（使用HTTP 301个重定向，规范标签和清理网页上的所有链接）
使您的网站更快（巨大冲击）
使其更轻KB聪明（漂亮影响，主要是因为速度更快）
将更独特的内容放在您的网页上。
防止重复内容
外部（从其他网站）链接到您的网页（而不是总数量是重要的，但随着时间的推移稳步增长）

PS：正如一个侧面说明 - 的爬行步骤是可选的。甚至未被抓取的网址（即，如果他们被robots.txt阻止）可以获得索引（和排名） - 但这不是很常见

来源

2011-04-05 07:22:42

非常感谢您的回答。我现在对Google的工作方式有了更好的理解！ – netNewbi3 2011-04-05 14:54:18

Afaik，如果页面没有链接到其他页面，则页面不会被编入索引。也许没有一个页面链接到非索引页面？

来源

2011-04-04 11:11:07

我同意丹尼尔。你需要一个包含链接列表的页面。或分页列表链接页面。

但dinamyc网址对SEO不利，最好的方式是友好的网址。看看ISAPIRewrite或路由。

我希望这对你有所帮助。

来源

2011-04-04 11:17:06

并非所有的页面都被编入索引，索引引擎简单地认为一些页面是不干预的。在我们的网站上，大约80％的网页都被编入索引，对于这类网站来说这是非常好的，只有极少数的网站具有更高的费率。

正如丹尼尔所说，链接到页面是至关重要的，否则它将不会被发现。然后该页面必须具有对该页面唯一的一些信息，并且最好是唯一的标题，或者可以将其分类为重复。

来源

2011-04-04 11:26:06 Guffa

未被Google索引的页面

回答

相关问题