我有一个包含链接的字符串。链接通常有以下形式:如何从URL中删除片段标识符?
http://www.address.com/something#something
有Python中的功能,可以从链接中删除“#something”?
我有一个包含链接的字符串。链接通常有以下形式:如何从URL中删除片段标识符?
http://www.address.com/something#something
有Python中的功能,可以从链接中删除“#something”?
只需使用split()
>>> foo = "http://www.address.com/something#something"
>>> foo = foo.split('#')[0]
>>> foo
'http://www.address.com/something'
>>>
试试这个:
>>> s="http://www.address.com/something#something"
>>> s1=s.split("#")[0]
>>> s1
'http://www.address.com/something'
>>> urlparse.urldefrag("http://www.address.com/something#something")
('http://www.address.com/something', 'something')
在Python 3中,urldefrag
功能现在是urllib.parse
部分:
from urllib.parse import urldefrag
unfragmented = urldefrag("http://www.address.com/something#something")
('http://www.address.com/something', 'something')
您可以分配掉不需要的部分,像这样
fixed, throwaway = urldefrag(url)
其中URL是支离破碎的地址。这比拆分好一点。我没有检查它是否更快或更有效。