在我的Rails应用程序中,我有如下的HTML,在Nokogiri中解析。如何使用Nokogiri和XPath或CSS选择器来选择一大块HTML?
我希望能够选择HTML的块。例如,如何使用XPath或CSS选择属于<sup id="21">
的HTML块?假设在真正的HTML中,********
的部分不存在。
我想分割HTML <sup id=*>
但问题是节点是兄弟姐妹。
<sup class="v" id="20">
1
</sup>
this is some random text
<p></p>
more random text
<sup class="footnote" value='fn1'>
[v]
</sup>
# ****************************** starting here
<sup class="v" id="21">
2
</sup>
now this is a different section
<p></p>
how do we keep this separate
<sup class="footnote" value='fn2'>
[x]
</sup>
# ****************************** ending here
<sup class="v" id="23">
3
</sup>
this is yet another different section
<p></p>
how do we keep this separate too
<sup class="footnote" value='fn3'>
[r]
</sup>
你在那里哼哼Nokogiri,对不对? –
@DavidWest这是正确的,最后的“甚至更通用”的代码是“重新打开”Nokogiri类,并添加一个新的实例方法,即“monkeypatching”。 – Phrogz