2015-09-06 60 views
-1

我正在爬这个网页的任何元素:使用scrapy shell命令行scrapy外壳没有显示我

我尝试提取任何元素,但我不断收到空的,虽然当我运行一个蜘蛛作为 https://dubai.dubizzle.com/property-for-rent/residential/apartmentflat/2015/8/5/huge-4-br-on-a-high-floor-now-available-2/?related_ads=1&back=ZHViYWkuZHViaXp6bGUuY29tL3Byb3BlcnR5LWZvci1yZW50L3Jlc2lkZW50aWFsL2FwYXJ0bWVudGZsYXQv

一个Python代码和提取蜘蛛元素的每一件事情的作品找到

请看看这张截图来自我的终端执行

enter image description here

+0

您是否尝试过:'response.xpath( “.//格”)'? – DrNightmare

回答

1

问题是您正在预先制定./,它使XPath上下文特定于树的根节点。换句话说,./div将使其搜索div元素,它是html的直接子元素。

相反,使用.//到HTML中的任何位置进行搜索:

response.xpath(".//div") 
+0

岩石错误由我。我不能相信我忘了这个:X:X谢谢你。你是蟒蛇黄金。我即将提出一个关于记录我的python最终项目的问题。请帮助请 –

+0

@MarcoDinatsoli好吧,创建一个问题,并在这里给我一个链接。谢谢。 – alecxe

+0

谢谢你,这是我的问题http://stackoverflow.com/questions/32435622/python-auto-documenting-the-project预先谢谢 –