我是新来的Xpath,试图scrapy网站下面的格式:Scrapy,蟒蛇,Xpath的如何匹配相应项目在HTML
<div class="top">
<a> tittle_name </a>
<div class="middle"> listed_date </div>
<div class="middle"> listed_value </div>
</div>
<div class="top">
<a> tittle_name </a>
<div class="middle"> listed_date </div>
</div>
<div class="top">
<a> tittle_name </a>
<div class="middle"> listed_value </div>
</div>
listed_value & listed_date的派驻都是可选的。
我需要将每个tittle_name与各自的listed_date,listed_value(如果可用)进行分组,然后向MySQL插入到达记录。
我使用scrapy shell这给像
listings = hxs.select('//div[@class=\'top\']')
for listing in listings:
tittle_name = listing.select('/a//text()').extract()
date_values = listing.select('//div[@class=\'middle\']')
上面代码中一些基本的例子给我tittle_name和可用listed_date的名单,listed_value,的名单,但如何搭配他们? (由于格式不对称,我们无法按索引进行搜索)。
谢谢。
是的,您是对的。能够决定listed_date&listed_value。但是每个tittle_name可能具有listed_date或listed_value,可能同时具有两个或者可能没有。格式不是对称的。因此,从上面的Python代码列表中,我不知道如何在尝试插入MySQL时将tittle_name与各自的listed_date,listed_value进行匹配。也许需要不同的方法? – learnJQueryUI 2011-03-18 06:26:23