2015-02-23 95 views
1

提取的innerText这里是我的问题。我有一个html内容: innerText 我需要提取“innerText”。虽然尝试这Jsoup我发现,当通过Jsoup解析的那张的innerText的锚标记之外。Jsoup:从锚标记

这里是我的代码

Document doc=Jsoup.parse("<div> <a href="#"> innerText </a> </div>"); 
System.out.println(doc.html()); 

输出:

<html> 
<head></head> 
<body> 
    <div > 
    <a href="#"></a>innerText 
    </div> 
</body> 
</html> 

为什么 “的innerText” 感动锚标记之外?

+0

您使用的是哪种版本的JSoup? – SubOptimal 2015-02-23 08:41:09

+0

@SubOptimal Jsoup-1.8.1 – 2015-02-23 09:29:36

+0

检查你的代码与1.8.1版本和我贴的回答仍然是有效的。 'innerText'显示在'a'标签内。 – SubOptimal 2015-02-23 10:33:50

回答

0

您可以通过调用元素的text()方法访问文本。

Document doc = Jsoup.parse("<div> <a href=\"#\"> innerText </a> </div>"); 
System.out.println(doc.html()); 
Elements rows = doc.getElementsByTag("a"); 
for (Element element : rows) { 
    System.out.println("element = " + element.text()); 
} 

btw。使用您的发布代码(和JSoup 1.8.1)会产生以下输出

<html> 
    <head></head> 
    <body> 
     <div> 
      <a href="#"> innerText </a> 
     </div> 
    </body> 
</html>