如何使用jsoup从网页中提取特定内容

我只需要从网页http://www.informatik.uni-trier.de/~ley/pers/hd/r/Rao:Rahul.html中提取这些出版物，其中第一作者是Rahul Rao。如何使用jsoup从网页中提取特定内容

我试过下面的代码，但它没有给我任何输出。

for(Element element : doc.select("table span.this-person.title")){ 
System.out.println(element.text()); 
}

我需要什么来获得首选输出？先谢谢你。

来源

2013-03-01 user1320030

请你们帮我出this.I我坚持在这里.... – user1320030 2013-03-02 06:35:25

下面的代码会给你预期的输出..看看它是否可以帮助你！

Document doc = Jsoup.connect（“http://www.informatik.uni-trier.de/~ley/pers/hd/r/Rao:Rahul.html”）.get（）; 元素span = doc.select（（“div [class = data]”））;

//System.out.println(span.tagName("span")); 
    for (Element src : span) { 

     for(int i=0;i<src.childNodeSize();i++){ 
      if(src.childNodes().get(0).toString().contains("Rahul Rao")){ 
       if(src.childNodes().get(i).toString().contains("<span class=\"title\">")){ 
        System.out.println(src.childNodes().get(i)); 
       } 

      }

来源

2013-03-02 12:31:49 Satyendra

谢谢Satyendra ... – user1320030 2013-03-02 13:12:46

我试图提取发布在页面上的出版物并取得了一些成功。

的代码如下：

Document doc = Jsoup.connect("http://www.informatik.uni-trier.de/~ley/pers/hd/r/Rao:Rahul.html").get(); 
    Elements span = doc.select("span"); 
    for (Element src : span) { 
     if (src.tagName().equals("span")){ 
      System.out.println(); 
      System.out.print(src.ownText()); 
     } 
    }

请看看是否有帮助！

来源

2013-03-02 08:12:25 Satyendra

但它给我的只有全部拉胡尔Rao..I的出版物需要这些出版物，其中拉胡尔·饶是第一作者。 – user1320030 2013-03-02 08:36:55

你能告诉我什么应该是你的预期产出或哪些出版物Rahul Rao是第一作者。 – Satyendra 2013-03-02 10:22:28

如何使用jsoup从网页中提取特定内容

回答

相关问题