2011-06-16 67 views
2

嗨如何使用python将文章的网址转换为打印网址。用Python切片url

文章的URL:http://www.indianexpress.com/news/second-time-as-farce/800228/0

打印网址:HTTP://www.indianexpress.com/story-print/800228/

如何将文章url转换为打印url?

回答

6

使用urllib.parse.urlparse()从URL的其余部分雕刻路径,posixpath.split()posixpath.join()改革路径,urllib.parse.urlunparse()再次把它全部重新走到一起。

+0

出于好奇,是否需要posixpath? urlparse总是会返回一个正斜杠。 – Jordan 2011-06-16 05:05:09

+0

你不想使用'os.path',因为在Windows上会给你'ntpath'。 – 2011-06-16 05:05:58

+0

在这种情况下硬编码正斜杠是否有问题? – Jordan 2011-06-16 05:07:32

0
from urllib.parse import urlparse 

def transform(url): 
    parsed = urlparse(url) 
    return '{0}://{1}/story-print/{2}/'.format(parsed.scheme, parsed.netloc, parsed.path.split('/')[-2]) 
+0

一定要检查标签。 – 2011-06-16 05:04:51

+0

被误解。我更新了导入。 – Jordan 2011-06-16 05:09:05