2013-03-01 84 views
0

我只需要从网页http://www.informatik.uni-trier.de/~ley/pers/hd/r/Rao:Rahul.html中提取这些出版物,其中第一作者是Rahul Rao。如何使用jsoup从网页中提取特定内容

我试过下面的代码,但它没有给我任何输出。

for(Element element : doc.select("table span.this-person.title")){ 
System.out.println(element.text()); 
} 

我需要什么来获得首选输出?先谢谢你。

+0

请你们帮我出this.I我坚持在这里.... – user1320030 2013-03-02 06:35:25

回答

1

下面的代码会给你预期的输出..看看它是否可以帮助你!

Document doc = Jsoup.connect(“http://www.informatik.uni-trier.de/~ley/pers/hd/r/Rao:Rahul.html”).get(); 元素span = doc.select((“div [class = data]”));

//System.out.println(span.tagName("span")); 
    for (Element src : span) { 

     for(int i=0;i<src.childNodeSize();i++){ 
      if(src.childNodes().get(0).toString().contains("Rahul Rao")){ 
       if(src.childNodes().get(i).toString().contains("<span class=\"title\">")){ 
        System.out.println(src.childNodes().get(i)); 
       } 

      } 
+0

谢谢Satyendra ... – user1320030 2013-03-02 13:12:46

0

我试图提取发布在页面上的出版物并取得了一些成功。

的代码如下:

Document doc = Jsoup.connect("http://www.informatik.uni-trier.de/~ley/pers/hd/r/Rao:Rahul.html").get(); 
    Elements span = doc.select("span"); 
    for (Element src : span) { 
     if (src.tagName().equals("span")){ 
      System.out.println(); 
      System.out.print(src.ownText()); 
     } 
    } 

请看看是否有帮助!

+0

但它给我的只有全部拉胡尔Rao..I的出版物需要这些出版物,其中拉胡尔·饶是第一作者。 – user1320030 2013-03-02 08:36:55

+0

你能告诉我什么应该是你的预期产出或哪些出版物Rahul Rao是第一作者。 – Satyendra 2013-03-02 10:22:28