2017-06-06 52 views
1

一个特殊的SRC为了得到一个网站的所有图像得到的href我写这篇文章的代码:如何与孩子格在Python Scrapy

content = Selector(text = html) 
all_images= content.css('img') 
i = 0 

for image in all_images: 
    src = image.css("::attr('src')").extract_first() 

获取图像的src后,现在我想有HREF每个图像的

<a href="/rayons/images" onclick="ga('send', 'event', 'computer HP', 'htwe', 'ope_xxl_s22Englos');"> 
    <img src="/mySrc/" alt="something" class="ze-content"> 
</a> 

我怎样才能得到HREF当我知道Src的

回答

3

AFAIK,你不能使用CSS做父母搜索。在这种情况下,XPath更合适。你可以这样做:

for image in all_images: 
    src = image.css("::attr('src')").extract_first() 
    href = image.xpath('parent::a/@href').extract_first() 

或者,使用XPath的abbreviated syntax

href = image.xpath('../@href').extract_first()