2015-12-15 77 views
0

我已经搜索了比任何东西都更正确的解决方案,但我仍无法修复。 请看这&帮助我。如何从多个网址获取文章内容

import java.io.BufferedReader; 
    import java.io.BufferedWriter; 
    import java.io.FileOutputStream; 
    import java.io.IOException; 
    import java.io.InputStreamReader; 
    import java.io.OutputStreamWriter; 
    import java.io.PrintWriter; 

    import org.jsoup.Jsoup; 
    import org.jsoup.nodes.Document; 
    import org.jsoup.nodes.Element; 
    import org.jsoup.select.Elements; 

    public class NewClass { 


    public static void main(String[] args) throws IOException { 


    Document doc = Jsoup.connect("http://tamilblog.ishafoundation.org").get(); 
     Elements section = doc.select("section#content"); 
    Elements article = section.select("article"); 
    for (Element a : article) { 
    System.out.println("Title : \n" + a.select("a").text()); 
    System.out.println("Article summary: \n" + a.select("div.entry-summary").text()); 

    } 

    } 
} 

我有上面的代码从一个页面获取文章及其内容。

Document doc = Jsoup.connect("http://tamilblog.ishafoundation.org").get(); 

我想为几个网站做这个。

在这一行或使用一些迭代,我想申请我的代码为几个网页说500+。 我想将它保存在文章标题及其内容下的单独文本文档中。

我是新来编码,所以我找不到正确的代码。

我在做这个代码过去两个月来创建我的代码。

回答

0

用于起动器,你可以做这样的事情,

String[] urls={"http://tamilblog.ishafoundation.org","url2","url3"};//your 500 urls wil be stored here, 

    for(String url: urls){ 
     Document doc = Jsoup.connect(url).get(); 
     Elements section = doc.select("section#content"); 
     Elements article = section.select("article"); 
     for (Element a : article) { 
      System.out.println("Title : \n" + a.select("a").text()); 
      System.out.println("Article summary: \n" + a.select("div.entry-summary").text()); 
     } 
    }