美丽汤与其他符号的URL替换某些符号

2017-09-25 63 views 2 likes

我解析某个网页与美丽的汤，尝试检索是H3标签内的所有链接：美丽汤与其他符号的URL替换某些符号

page = = requests.get(https://www....) 
soup = BeautifulSoup(page.text, "html.parser") 
links = [] 
for item in soup.find_all('h3'): 
links.append(item.a['href']

然而，找到的链接比不同该页面中存在的链接。例如，当页面中存在链接http://www.estense.com/?p=116872时，Beautiful soup会返回http://www.estense.com/%3Fp%3D116872，替换'？' '％3F'和'='与％3D。这是为什么？

谢谢。

来源

2017-09-25 user1767774

它的URL逃逸解除引用的URL。但我无法重现这个问题。你使用的是什么版本的Python？ –

我使用Python 3.5.3。 – user1767774

回答

可以使用urllib.parse

from urllib import parse 
parse.unquote(item.a['href'])

来源

2017-09-25 09:40:16 chad

谢谢，但能否请您解释这个问题的起源？ – user1767774

原因可能是来自' chad

相关问题

1. 与美丽的汤
2. 将字符串中的其他符号与某些符号分开
3. 美丽的汤URL错误
4. 与美丽的汤解析
5. 刮表与美丽的汤
6. 网络与美丽的汤
7. 与元件替换XSLT版权符号和其它符号
8. Python美丽的汤
9. 某些字符不能用逗号替换字符吗？
10. 替换·符号
11. 替换＆符号
12. 美丽的汤| Python | URL循环
13. 如何用PHP中的其他字符串替换“$”符号？
14. 额外的换行符为美丽的汤
15. （python）使用美丽的汤解析某些HTML输出标签
16. 替换字符与其他字符“链”
17. 美丽的汤，消除了与的findAll（）
18. 使用符号链接替换某些文件的shell脚本
19. MATLAB符号替换
20. 添加父标签与美丽的汤
21. 解析HTML表格与美丽的汤
22. 解析KML与美丽的汤
23. 美丽的汤引发UnicodeEncodeError“序号不在范围内（128）”
24. 美元符号
25. 美丽的汤和uTidy
26. 美丽的汤 - 文档
27. python 3的美丽汤4
28. 美丽的汤VS ESPN
29. 美丽的汤解析表
30. Python美丽的汤编码