从URL中读取HTML文件

虽然大部分时间我只是使用file_get_contents和CURL，但我无法让它在URL中使用端口。我怎样才能读取这个文件？ http://174.120.124.178:7800/7.html（这是一个shoutcast统计文件）从URL中读取HTML文件

最终，我只是想在最后一个逗号后面的文本。

2011-02-27 Jimmy

请出示一些代码 – 2011-02-27 23:09:55

它与港口无关。他们阻止你，因为你没有使用浏览器用户代理。 curl确实让您伪造用户代理，但这可能违反了网站的服务条款。

根据this post这不是关于阻止脚本，而是区分Shoutcast客户端和其他一切。因此，代码为：

curl_setopt($curl_handle, CURLOPT_USERAGENT, "Mozilla");

2011-02-27 23:10:04

虽然这确实解决了我的代码问题，但最终的问题是我的共享主机帐户不允许我在80或443以外的端口上使用CURL。 – Jimmy 2011-02-28 23:27:13

我试图用命令行下载Curl文件并得到404错误;它确实加载了Firefox和Lynx。 This page表示您需要更改要下载的User-Agent字符串。

2011-02-27 23:09:12

阅读各种论坛的帖子，你只需要一个'用户Agent'头包含Mozilla的' “它里面的某个地方;请参阅http://forums.shoutcast.com/showthread.php?t=147753。 – 2011-02-27 23:16:37

CURLOPT_PORT需要设置到相应的端口也许〜

2011-02-27 23:10:42 Shad

回答