2015-03-02 66 views
0

我试图做一些网页刮,但我在参加亲戚和根网址加盟网址urljoin在python

例如根URL是一些问题:http://www.jmlr.org/proceedings/papers/v2

,相对网址是: ../v2/meila07a/meila07a.pdf

正如我在使用里urlparse urljoin:结果是奇数:

http://www.jmlr.org/proceedings/v2/meila07a/meila07a.pdf

这不是一个有效的链接。有人可以帮助我吗?

回答

0

两个点(..)表示返回一次在层次结构中,将第二个链接更改为./v2/meila07a/meila07a.pdf,它应该工作正常。

或者,您也可以将根目录更改为http://www.jmlr.org/proceedings/papers/v2/,由于此更改,因此根目录未设置为正确的目录,因此不再处理v2