2015-08-15 37 views

回答

1

你可以试试下面的XPath来获取备用ID值:

//tr/th[normalize-space()='Alternate IDs:']/following-sibling::td[1] 

简要说明:

  • //tr:任何地方找到所有<tr>元素的HTML文档
  • /th[normalize-space()='Alternate IDs:']在:从发现tr元素,找到子元素th有(除去多余的空格之后)内的文本等于"Alternate IDs:"
  • following-sibling::td[1]:从这样的th,返回第一个td元素,它跟在同一父代中的th元素tr
+0

你知道你会如何尝试从这样的东西得到每个字符串? '​​IIlIIllIlII(NA)
SKT T1影响
风暴影响
的TiP影响(NA)
Painsimpact(NA)
康夫古薮(NA) ' –

+0

@JasonAttwood我不知道引入nokogiri,但XPath的,我可以加上'/text()'来分别获取每个文本/字符串 – har07