在问这个问题之前,我已经查看了多个表单。基本上,我需要的是在HTML文件中选择部分文本。 html的构造是这样的在html中选择文本的一部分使用Java
<div class = "pane big">
<code>
<pre>
SomeText
<a id="par1" href="#par1">¶</a>
MoreText
.
.
.
<a id="par2" href="#par2">¶</a>
MoreText
</pre>
</code>
</div>
所以我需要做的,是通过自身提取href标记PAR1下面的文本,然后分别得到下PAR2 href标记的文字。我试图使用Jsoup,但我所能做的只是选择整个文本与div。还尝试过XPath,但我正在评估的表达式不被接受。不确定也许是因为它不是以XML文件开头的。
以及我使用的XPath表达式的示例。
/html/body/div/div[2]/code[2]/pre/text()[3]
和CSS
body > div > div.pane.big > code:nth-child(7) > pre
否我需要MoreText部分,而不是封闭的href标签之间的文本。谢谢您的回复 – Dreamer