我需要剥离HTML文档中的一些值和一些原始HTML。我想过使用XPath,但我无法让我的查询工作。PHP和XPath查询
这里是我想达到的目标:
<div class="unit-id">
<div class="title">
some title-1
</div>
<div class="another-class">
another class
</div>
<p>segwegw1<p>
<p>segwegw1<p>
<p>segwegw1<p>
<p>segwegw1<p>
<ul>
<li>jfjfj</li>
<li>jfjfj</li>
<li>jfjfj</li>
</ul>
</div>
<div class="unit-id">
<div class="title">
some title-2
</div>
<div class="another-class">
some other class
</div>
<p>segwegw2<p>
<p>segwegw2<p>
<p>segwegw2<p>
<p>segwegw2<p>
</div>
<div class="unit-id">
<div class="title">
some title-3
</div>
<div class="some-other-class">
some other data
</div>
<p>segwegw3<p>
<p>segwegw3<p>
<p>segwegw3<p>
<p>segwegw3<p>
</div>
所以我想查询通过每个div
一个单位ID级别迭代和带班的title
返回divs
的价值, HTML的其余部分,除了divs
以外,还有p
标签和ul
这些特殊的单元ID分类为div
,然后进行下一次迭代。
这可能吗?你能否给我提供一个如何编写这个查询的例子?有没有更好的方法来做到这一点?
你有什么企图到目前为止,计算器是不是写你的代码,但更多的固定你有问题,你有没有代码来显示。 – Kivylius 2013-05-13 17:11:09
我已经创建了查询来返回与类unit-id(查询(“//div [@ class ='unit-id']”)的div元素的集合,但是,然后我需要返回以下所有非div元素,直到下一个具有'unit-id'类的div。这个我很苦恼。有没有比使用xpath查询更好的方法? – daktau 2013-05-13 18:30:40
@Jessica - 在StackOverflow中问过的一些最好的问题被问到而不会显示任何不成功的代码。查看此链接:http://meta.stackexchange.com/questions/122986/is-it-ok-to-leave-what-have-you-tried-comments – 2013-05-13 19:35:37