我正在使用Scrapy进行屏幕抓取项目,并且遇到XPath问题。XPath不能用于屏幕抓取
我想从下面的图像中获得94,218,但我用过的XPath和CSS不起作用。
这是从这个页面:https://fancy.com/things/280558613/I%27m-Fine-T-Shirt
我已经试过多次的XPath和CSS与Scrapy但一切都返回空白。
下面是一些例子:
response.xpath('/html/body/div[1]/div[1]/div[1]/aside/div[1]/div/div/a[2]/text()').extract()
response.xpath('//*[@id="sidebar"]/div[1]/div/div/a[2]/text()').extract()
response.xpath('//*[contains(concat(" ", @class, " "), concat(" ", "fancyd_list", " "))])'.extract()
response.xpath(".//*[@id='sidebar']/div[1]/div/div/a[2]/text()")
我试过萤火虫,Firepath,Chrome浏览器开发工具和不同的插件,但没有的XPath或CSS似乎工作..有人可以帮助?
实际网页上的代码是:
<a href="#" class="fancyd_list "/>
6
</a>
一些的XPath的工作,但他们不包含文本,所以它看起来是这样的:<a href="#" class="fancyd_list "/></a>
我使用BeautifulSoup也试过,但它有同样的问题:
print soup.find_all('a',class_='fancyd_list')
[<a class="fancyd_list " href="#"></a>, <a class="fancyd_list " href="#"></a>]
谢谢!
这种类型的解析总是让我疯狂。使用'美丽的汤',我敢打赌这将是微不足道的。 – RobertB
嘿谢谢@RobertB会给出一个破解,远离它,因为我听到的表现并不是最好的 – bnussey
嘿@RobertB只是试过BeautifulSoup并得到了同样的问题 – bnussey