2011-06-13 54 views
7

有许多不同的网站,让你监控specifi网页的任何变化,如watchthatpage.com或page2rss.com的网页监控问题

我感兴趣的方式如何这些网站工作,这意味着他们如何确定某个网页是否已更新。他们只是复制页面中的所有文本,将其存储在内存中,并稍后将其与网站页面的内容进行比较? 或者,他们可能会寻找一些特定的html元素并比较它们的值?

请帮我找到答案。

回答

0

我怀疑他们存储的全部内容,每次他们检查,他们比较。如果不同,发送警报,否则不要。

0

有两种方法可以做到这一点,就在我的头顶。

第一个是拉HTML并做一个简单的string.compare。

第二种方法是做一个HEAD请求参见第9.4节here