2015-11-19 54 views
0

我试图提取使用XPath从URL中的地址一样的XPath不同的节点号

https://www.americangemsociety.org/bradshaw-s-jewelers https://www.americangemsociety.org/fincher-ozment-jewelers

然而,问题是地址的位置不统一整个页面。一些页面在段落节点#4上具有地址,而另一些在段落节点#2上具有它们,等等。

我在想,如果我可以使用识别基于地址,而不是特定的节点#的HTML

<p><strong class="">Address:</strong> 4355 Montgomery Hwy, Ste 2, Dothan, Alabama 36303-1696</p> 

内地址的

例中的“强类的地址的XPath请告知

感谢

回答

1

如果使用//p[strong[not(normalize-space(@class)) and . = 'Address:']]然后可以选择所有p元件,其续包含内容​​的strong元素。

+0

非常感谢您的回答,马丁。这工作完美。 –