2016-12-06 90 views
0

它可以通过任何方式来抓取来自站点的所有头文件请求,该请求会在浏览器网络工具(也许是selemium)中加载?Python抓取标题请求

我需要这个URL enter image description here

+0

我们可以使用python请求模块吗? –

+0

是的,任何方式,我需要抓住所有这些网址 –

+0

'URL'不是一个标题。还有'URL'发送的参数不是标题 – Andersson

回答

0

试试这个代码,让我知道的任何问题的情况下:

links = [] 
for element in driver.find_elements_by_xpath('//head/*[@href or @src]): 
    link = element.get_attribute("href") 
    links.append(element.get_attribute("href")) if link != '' else links.append(element.get_attribute("src")) 

要想从内部框架链接也可能需要补充一点:

for frame in driver.find_elements_by_tag_name('iframe'): 
    driver.switch_to_frame(frame) 
    for element in driver.find_elements_by_xpath('//head/*[@href or @src]): 
     link = element.get_attribute("href") 
     links.append(element.get_attribute("href")) if link != '' else links.append(element.get_attribute("src")) 
    driver.switch_to_default_content() 
+0

它只返回网页上的网址,但没有来自第三方的网址(如谷歌),我需要解析这样的网址 - 请求网址:https://googleads.g.doubleclick.net/pagead/ads?client = ca -pub -... –

+0

此链接放置在iframe中 –

+0

检查更新回答 – Andersson