0
A
回答
0
试试这个代码,让我知道的任何问题的情况下:
links = []
for element in driver.find_elements_by_xpath('//head/*[@href or @src]):
link = element.get_attribute("href")
links.append(element.get_attribute("href")) if link != '' else links.append(element.get_attribute("src"))
要想从内部框架链接也可能需要补充一点:
for frame in driver.find_elements_by_tag_name('iframe'):
driver.switch_to_frame(frame)
for element in driver.find_elements_by_xpath('//head/*[@href or @src]):
link = element.get_attribute("href")
links.append(element.get_attribute("href")) if link != '' else links.append(element.get_attribute("src"))
driver.switch_to_default_content()
+0
它只返回网页上的网址,但没有来自第三方的网址(如谷歌),我需要解析这样的网址 - 请求网址:https://googleads.g.doubleclick.net/pagead/ads?client = ca -pub -... –
+0
此链接放置在iframe中 –
+0
检查更新回答 – Andersson
相关问题
- 1. Android Web请求标题抓取
- 2. 抓取AJAX请求
- 3. 抓取时请求?
- 4. GitKraken:抓取请求失败
- 5. Python - 有序标题HTTP请求
- 6. 使用Python和请求抓取网页时的字符集问题
- 7. 从请求中抓取参数
- 8. Facebook的抓取权限请求表单?
- 9. 尝试...抓取和HTTP请求
- 10. 骨干收集抓取并请求
- 11. 跨域ajax请求jquery抓取CSV
- 12. python web抓取:onclick ajax请求返回没有状态200
- 13. Python - 如何启用Cookie与Web请求抓取?
- 14. Python请求:似乎无法升级头从csrftoken从cookie抓取
- 15. 使用python请求模块抓取网页时出现错误
- 16. Python的 - 超级简单的抓取与请求和BS4
- 17. Python Web抓取请求自动登录不工作
- 18. scala play 2.0获取请求标题
- 19. 请求标题字段X请求
- 20. python POST请求问题
- 21. 抓取Python中的html标签时抓取
- 22. 阅读请求标题
- 23. symfony 2.0.22请求标题null
- 24. iphone发布请求标题
- 25. web.py获取请求标头
- 26. Http获取请求问题
- 27. 使用python抓取网页中的标题
- 28. scrapy/Python抓取但不抓取数据
- 29. 使用标题与Robot Framework请求库的“获取请求”关键字
- 30. 使用python中的请求库进行抓取时管理会话
我们可以使用python请求模块吗? –
是的,任何方式,我需要抓住所有这些网址 –
'URL'不是一个标题。还有'URL'发送的参数不是标题 – Andersson