嗨如何使用python将文章的网址转换为打印网址。用Python切片url
文章的URL:http://www.indianexpress.com/news/second-time-as-farce/800228/0
打印网址:HTTP://www.indianexpress.com/story-print/800228/
如何将文章url转换为打印url?
嗨如何使用python将文章的网址转换为打印网址。用Python切片url
文章的URL:http://www.indianexpress.com/news/second-time-as-farce/800228/0
打印网址:HTTP://www.indianexpress.com/story-print/800228/
如何将文章url转换为打印url?
使用urllib.parse.urlparse()
从URL的其余部分雕刻路径,posixpath.split()
和posixpath.join()
改革路径,urllib.parse.urlunparse()
再次把它全部重新走到一起。
from urllib.parse import urlparse
def transform(url):
parsed = urlparse(url)
return '{0}://{1}/story-print/{2}/'.format(parsed.scheme, parsed.netloc, parsed.path.split('/')[-2])
一定要检查标签。 – 2011-06-16 05:04:51
被误解。我更新了导入。 – Jordan 2011-06-16 05:09:05
出于好奇,是否需要posixpath? urlparse总是会返回一个正斜杠。 – Jordan 2011-06-16 05:05:09
你不想使用'os.path',因为在Windows上会给你'ntpath'。 – 2011-06-16 05:05:58
在这种情况下硬编码正斜杠是否有问题? – Jordan 2011-06-16 05:07:32