2014-02-26 30 views
0

从那里我想刮我的数据代码:Scrapy XPath查询(从同级但不同对准标记刮痧)

<td class="pageHeading" valign="top">ABC<br><span class="smallText">[RK103401]</span></td> 
      <td class="pageHeading" align="right" valign="top">SAMPLE2<br> 

我想知道的XPath,这将导致我提取SAMPLE2。

我注意到类名是相同的,但不知道如何去做这件事。

谢谢!

+0

// TD [@类= 'pageHeading'] /文() 但是,让所有的值。只需要Sample2 – quasarseeker

+0

你想要“Sample2”基于什么标准?文本值本身?一些数据之前?父'table'中'td'的位置? –

+0

我只是需要文字。 – quasarseeker

回答

0

在查找XPath以选择特定的内容时,您希望找到一个与您想要捕获的内容相对应的元素。在这里,很难说因为没有太多的HTML,所以我们不知道哪些元素不会在整个文档中重复。

像这样的事情可能做的伎俩:

//td[class="pageHeading" and align="right"]/text()