2011-02-27 80 views
0

虽然大部分时间我只是使用file_get_contents和CURL,但我无法让它在URL中使用端口。我怎样才能读取这个文件? http://174.120.124.178:7800/7.html(这是一个shoutcast统计文件)从URL中读取HTML文件

最终,我只是想在最后一个逗号后面的文本。

+0

请出示一些代码 – 2011-02-27 23:09:55

回答

4

它与港口无关。他们阻止你,因为你没有使用浏览器用户代理。 curl确实让您伪造用户代理,但这可能违反了网站的服务条款。

根据this post这不是关于阻止脚本,而是区分Shoutcast客户端和其他一切。因此,代码为:

curl_setopt($curl_handle, CURLOPT_USERAGENT, "Mozilla"); 
+0

虽然这确实解决了我的代码问题,但最终的问题是我的共享主机帐户不允许我在80或443以外的端口上使用CURL。 – Jimmy 2011-02-28 23:27:13

0

我试图用命令行下载Curl文件并得到404错误;它确实加载了Firefox和Lynx。 This page表示您需要更改要下载的User-Agent字符串。

+1

阅读各种论坛的帖子,你只需要一个'用户Agent'头包含Mozilla的' “它里面的某个地方;请参阅http://forums.shoutcast.com/showthread.php?t=147753。 – 2011-02-27 23:16:37

0

CURLOPT_PORT需要设置到相应的端口也许〜