2010-08-17 82 views
1

背景将RSS提交作为站点地图提交给Google?

我为承载一个新闻网站,拥有超过7.5万页的在线媒体公司工作。我们目前使用Google Sitemap Generator(安装在我们的服务器上)为我们的网站构建动态XML站点地图。实际上,由于我们有大量内容,因此我们使用站点地图的站点地图。 (谷歌只允许最多50K网址。)

问题

的站点地图生成每12小时,并通过用户行为来驱动。也就是说,它解析服务器日志文件,并查看哪些页面被抓取得最多,并基于此创建站点地图。

由于我们无法保证将新网页添加到站点地图,因此最好是将站点地图提交为RSS源?这样,每当我们的编辑创建一个新的页面(或文章)时,它就会添加到Feed中并提交给Google。这引发了将重复内容推送到谷歌的问题,因为站点地图和RSS提要可能包含相同的URL。谷歌会惩罚我们的重复内容?其他内容丰富或媒体网站如何通知谷歌他们正在发布新内容?

据我所知,googlebots只索引它认为重要且相关的网页,但如果至少抓取了我们发布的任何新文章,那将会很棒。

任何帮助将不胜感激。

回答

1

为什么不简单地在您的站点地图中每页面有? 75k页面并不是一个庞大的数字,大量的网站有几个网站地图总共数百万页,谷歌会将它们全部消化(尽管谷歌只会索引你认为重要的那些)。

对于您来说,一种技术是将站点地图根据发布日期分成新建和存档内容 - 例如前7天内的所有内容的单个站点地图和其他内容分割为其他站点地图文件在适当的情况下,这可能有助于快速获取最新索引的内容。

回到关于RSS源站点地图的问题 - 不必担心重复的内容,因为这对于站点地图而言不是问题。如果您在网站上多次发布同一文章,则重复的内容只是一个问题 - 站点地图和RSS源只是链接而不是内容本身,所以如果RSS源是报告新鲜内容的最简单方式去谷歌,去吧。