我正在使用scrapy从网页中提取数据。我想提取的跨度标签下锚标签的文字如下图所示:全部废除文本<a>使用scrapy的span标记下的标记
<span>.....</span>
<span id = "size_selection_list">
<a>....</a>
<a>....</a>
.
.
.
<a>
</span>
我使用以下XPath逻辑:
t = sel.xpath('//div[starts-with(@id,"size_selection_container")]/span[2]')
for x in t.xpath('.//a'):
....
是达到这个问题的跨度元素,但<a>
标签不会迭代。这里有什么错误?另外<a>
有一个HREF有JavaScript。这是问题的原因吗?
你的逻辑将与您提供的样本HTML:http://pastebin.com/hxSZ041j。因此,要么不按原样分享代码,要么示例HTML不是您正在使用的代码。 –