我需要您的帮助Pythonists:我抓取所有以“details.php?”开头的网址来自this page并忽略所有其他网址。从网页中刮去特定的网址,并将它们转换为绝对网址
然后,我需要将我刚刚刮到的每个网址都转换为绝对网址,所以我可以一个接一个地刮。绝对网址开头为:http://evenementen.uitslagen.nl/2013/marathonrotterdam/details.php ...
我尝试使用re.findall
这样的:
html = scraperwiki.scrape(url)
if html is not None:
endofurl = re.findall("details.php?(.*?)>", html)
这让我一个名单,但我会被卡住。有人可以帮我吗?