2010-05-08 166 views
1

我正在尝试使用curl和php从RSS feed中获取某些页面。当我刚刚使用实际链接时,页面抓取工作正常,而不是来自rss提要的链接。不过,我现在意识到rss feeds中的链接通常只是重定向到实际页面(至少这是它的样子)。因为现在当我用rss链接刮一个页面时,它实际上并没有获得我正在寻找的信息。从RSS订阅链接获得真正的链接

有没有人遇到过这种情况,并知道解决方法。无论如何,看看rss链接重定向到哪里并捕获该值?

回答

0

我想你可能需要使用-L开关告诉它遵循重定向。我不确定您是否可以直接从PHP执行此操作,或者您是否需要遵循此方法http://php.net/manual/en/function.curl-setopt.php#95027。通过用户代理或其他方式来拦截您的网站总是可能的。也许尝试运行Fiddler或类似的浏览器中的链接之一,看看是否有任何重定向实际发生。

+0

谢谢,是的,我设法找到一个脚本,通过重定向循环,找到最后一个。似乎大多数网站不会被useragent阻止,但有一些。 – pfunc 2010-05-10 13:30:29