好吧,我被要求监视几个约10-20个网站的任何变化。
我一直在试图获取这些网站的标题信息,并使用这种方法检查他们的最后更新时间。监控页面的更改吗?
url = new URL("http://www.wikipedia.org/");
HttpURLConnection httpConnection = (HttpURLConnection)url.openConnection();
System.out.println("Connection established");
httpConnection.setRequestMethod("HEAD");
httpConnection.connect();
long lastModified = httpConnection.getLastModified();
if(lastModified != 0) {
System.out.println(new Date(lastModified));
} else {
System.out.println("Last-Modified not returned");
}
httpConnection.disconnect();`
但是,这种方法的问题是,一些网站(很多)不把完整的头信息。我也想知道这是向服务器发出头部请求的正确方式还是我错过了什么?
有没有其他的方式来监控一个网站?
我一直在将整个网站转换为md5值,然后监控网站,但这种方法过于敏感,即使是最小的变化也会通知我。
哈哈感谢队友......我想我只会在页面的body/content部分MD5中看看它的效果。 – haedes 2013-02-28 10:34:22