如果我使用wget
下载this页:HTML文件获取“wget的”报告为二进制“少”
wget http://www.aqr.com/ResearchDetails.htm -O page.html
,然后尝试在less
查看页面,少报告的文件作为一个二进制文件。
less page.html
"page.html" may be a binary file. See it anyway?
这些响应头:
Accept-Ranges:bytes
Cache-Control:private
Content-Encoding:gzip
Content-Length:8295
Content-Type:text/html
Cteonnt-Length:44064
Date:Sun, 25 Sep 2011 12:15:53 GMT
ETag:"c0859e4e785ecc1:6cd"
Last-Modified:Fri, 19 Aug 2011 14:00:09 GMT
Server:Microsoft-IIS/6.0
X-Powered-By:ASP.NET
打开该文件在vim工作正常。
任何线索为什么不能处理它?
郁闷在HTML元中它被报告为“charset = iso-8859-1” - 大概这只是错误的? – Joel
绝对不是ISO-8859-1。也许它来自一个模板或者文件被意外地用UTF-16保存。 – palacsint