1
我试图让报废让统计在此URL Scrapy不返回结果使用XPath
http://www.acb.com/redaccion.php?id=133495
我首先与玩家名称尝试:
进口scrapy 进口从scrapy.item请求 import Item,领域 from ligafemanager.items进口LigafemanagerItem
class Lf1Spider(scrapy.Spider):
name = 'lf1'
allowed_domains = ['acb.com']
start_urls = ['http://www.acb.com/redaccion.php?id=133495']
def parse(self, response):
self.logger.info('A response from %s just arrived!', response.url)
i = LigafemanagerItem()
i['acb_player_name'] = response.xpath('//td/div/codigo/table[1]/tbody/tr/td[2]/font/text()').extract()
self.logger.info('------------ACB NAME is: %s ------',
i['acb_player_name'])
return i
永不返回结果
首先感谢您的帮助,有一个问题,如果我写 // TD/DIV/codigo /表/ TR/TD [2] /字体/文本()“)。摘录() 不会返回所有名称,只有第一个TR解决方案? –
那么应该是“// td/div/codigo // table/tr/td [2]/font/text()”您需要使用“//”来匹配任何子节点。因此,而不是使用'/ table'来使用'// table' –