2011-04-04 86 views
0

据我所知,我的公司已在我们的网站上运行Google搜索。我开发了一个文档系统,也正在被Google索引。系统中的页面是动态生成的,因此我有www.mysite.com/doc.aspx?id=234,www.mysite.com/doc.aspx?id=236等索引。事情是,一些随机页面(比如www.mysite.com/doc.aspx?id=235)未被索引,原因不明。我希望在哪里解决这个问题?有任何想法吗?未被Google索引的页面

回答

5

这里是谷歌如何处理您的网站()

discovery -> crawling -> indexing -> ranking (->feedback) 

发现短,很simpliefied概要: 是谷歌发现你的网站(S)的网页的过程中,这样可以既可以通过HTML或通过一个sitemap.xml的链接完成(在JavaScript的的onpage,RSS或Atom和URL饲料,...基本上任何URL谷歌能找到一些)

爬行: 的谷歌抓取过程Ť他内容的发现URL的(和推新发现的网址进入发现队列)

索引: 存储发现并检索内容到他们的数据库,并使其可搜索

排名: 匹配通过用户查询索引内容并 - 如果足够重要 - 将其作为可见的SERP列表返回给用户。基于点击

反馈 /不点击行为,并从其他渠道(假定ISDN数据和谷歌工具栏,chrome浏览器报告,...),谷歌收集反馈收集有关用户行为上它的SERP数据(并在点击后)。

  • 每一步之间的质量指标(最后一步就是 只是一个质量指标收集 步骤)的很多 。
  • 每一步都会报告回 之前的步骤。

因此,基本上即使您将所有的网址传送到谷歌(即通过sitemap.xml),谷歌也不一定会抓取您的所有网址或索引或将它们排序为可见。

好的,那么低挂果实能够获得更多的页面进入索引(​​他们至少有机会排名)?

  • 沟通每页只有一个URL(使用HTTP 301个重定向,规范标签和清理网页上的所有链接)
  • 使您的网站更快(巨大冲击)
  • 使其更轻KB聪明(漂亮影响,主要是因为速度更快)
  • 将更独特的内容放在您的网页上。
  • 防止重复内容
  • 外部(从其他网站)链接到您的网页(而不是总数量是重要的,但随着时间的推移稳步增长)

PS:正如一个侧面说明 - 的爬行步骤是可选的。甚至未被抓取的网址(即,如果他们被robots.txt阻止)可以获得索引(和排名) - 但这不是很常见

+0

非常感谢您的回答。我现在对Google的工作方式有了更好的理解! – netNewbi3 2011-04-05 14:54:18

0

Afaik,如果页面没有链接到其他页面,则页面不会被编入索引。也许没有一个页面链接到非索引页面?

0

我同意丹尼尔。你需要一个包含链接列表的页面。或分页列表链接页面。

但dinamyc网址对SEO不利,最好的方式是友好的网址。看看ISAPIRewrite或路由。

我希望这对你有所帮助。

0

并非所有的页面都被编入索引,索引引擎简单地认为一些页面是不干预的。在我们的网站上,大约80%的网页都被编入索引,对于这类网站来说这是非常好的,只有极少数的网站具有更高的费率。

正如丹尼尔所说,链接到页面是至关重要的,否则它将不会被发现。然后该页面必须具有对该页面唯一的一些信息,并且最好是唯一的标题,或者可以将其分类为重复。

相关问题