2017-02-11 95 views
2

(声明:我只隐约知道蟒蛇&非常新的编码)使用XPath获得Python中的链接的锚文本链接时没有类

我试图获得的文本部分一个link,但它没有一个特定的类,并根据我的代码我得到的方式我得到太多的东西(xpath不够具体)或空白[]。

的什么,我试图访问一个截图:

enter image description here

树是从所有页面的HTML。 返回一个空的代码是:

cardInfo=tree.xpath('div[@class="cardDetails"]/table/tbody/tr/td[2]/a/text()')

返回了太多的代码:

cardInfo=tree.xpath('a[contains(@href, 'domain_name')]/text()')

我试图进入铬检查和复制的XPath,这也给了我一无所有。我已经成功地从页面中获得了纯文本而不是链接的其他内容。非常抱歉,如果我没有解释得这么好,但是有没有人知道我能写些什么?

+0

PI轻松向我们提供您正在抓取的网址, –

+0

绝对,对不起! [链接](http://shop.tcgplayer.com/pokemon/jungle/nidoqueen-7) –

+0

你正在使用lxml吗? –

回答

2

如果你的意思是下一个找到的文本Set Name:

>>> import lxml.html 
>>> tree = lxml.html.parse('http://shop.tcgplayer.com/pokemon/jungle/nidoqueen-7') 
>>> tree.xpath(".//b[text()='Set Name:']/parent::td/following-sibling::td/a/text()") 
['Jungle'] 
  • .//b[text()='Set Name:']找到b标签与Set Name:文字,
  • parent::td - 它的母公司TD元素,
  • following-sibling::td - 以下TD元素