有没有一种标准方式来判断页面上次修改时间?目前,我这样做:使用Java获取页面的最后修改日期
URLConnection uCon = url.openConnection();
uCon.setConnectTimeout(5000); // 5 seconds
String lastMod = uCon.getHeaderField("Last-Modified");
System.out.println("last mod: "+lastMod);
但是它看起来像一些网站没有Last-Modified
场。
http://www.cbc.ca具有这些字段:
X-Origin-Server
Connection
Expires
null
Date
Server
Content-Type
Transfer-Encoding
Cache-Control
我可以分析一个网页,试图得到它的日期,但是这似乎是一个重大的痛苦。标准是什么?
(如果可能的话,我想坚持使用URLConnection的,因为这是我用来下载网页)
呵呵,那也是我的想法。谢谢! – sixtyfootersdude 2010-10-30 19:33:32