2016-08-30 116 views
1

有解析的java jsoup解析如何解析HTML

<a href="/summoner/userName=Huhi" class="Link">Huhi</a> 

在HTML中任何可能的方式:

<a href="/summoner/userName=Huhi" class="Link">Huhi</a> 
<a href="/summoner/userName=Huhi" class="Link">White</a> 
<a href="/summoner/userName=Huhi" class="Link">Angle</a> 

输出:

Huhi 
White 
Angle 
+0

'select'每个'了'并打印其'文本( )'? – Pshemo

回答

1

创建文档,并让所有的[href]链接,遍历这些链接并获取它们包含的文本。像这样:

Document doc = Jsoup.connect(url).get(); 
Elements links = doc.select("a[href]"); 
for (Element link : links) { 
    String text = link.text(); 
} 
1

您只需选择a和迭代elements和打印

String html ="<a href=\"/summoner/userName=Huhi\" class=\"Link\">Huhi</a>\n" + 
       "<a href=\"/summoner/userName=Huhi\" class=\"Link\">White</a>\n" + 
       "<a href=\"/summoner/userName=Huhi\" class=\"Link\">Angle</a>"; 

     Document doc = Jsoup.parse(html); 
     Elements links = doc.select("a"); 
     for (Element link : links) { 
      System.out.println(link.text()); 

     } 

更多参考检查此链接selector-syntax

+0

我已经得到了这一点,现在我有这个问题.. http://stackoverflow.com/questions/39238695/java-jsoup-remove-new-lines/39240666?noredirect=1#comment65818367_39240666 – nooby