2014-12-04 68 views
0

林之间的文本试图让一个<a>标签之间的文本,但它不想要工作,但它确实工作<strong>标签如何提取<a>超级链接标签

代码:

例有标签不工作

public static void init() throws SQLException, InstantiationException, IllegalAccessException, ClassNotFoundException, IOException{ 

    Document doc = Jsoup.connect("https://www.google.com.au/webhp?sourceid=chrome-instant&ion=1&espv=2&ie=UTF-8#q=example").timeout(20*1000).get(); 
    Elements taglink=doc.select("#rso > div.srg > li:nth-child(1) > div > h3 > a"); 
    StringBuilder sb = new StringBuilder(taglink.text()); 
    System.out.println("Text "+sb); 
} 
+1

你能告诉我们一个文档的片段吗?而那个工程。 – weston 2014-12-04 08:40:40

+0

如果它适用于'strong''标签,它应该适用于''a''标签,解析器没有什么区别。检查你的文档是否存在''a''标签作为'strong'的邻居。 编辑:请给我们显示文件和真实的代码。第1行显然被破坏,选择器不是您在代码中使用的选择器。 – f1sh 2014-12-04 08:41:02

+0

@weston嘿,人更好吗? – HelloWorld 2014-12-04 08:49:45

回答

1
doc = Jsoup.connect("http://google.com").get(); 

Elements links = doc.select("a[href]"); 
    for (Element link : links) { 

     System.out.println("\nlink : " + link.attr("href")); 
     System.out.println("text : " + link.text()); 

}

您可以尝试使用此代码获取所有超链接以及超链接之间的文本。尝试此操作,并让我知道是否还有其他问题。