2011-11-22 104 views
9

如何提取位于以下位置的表格内容: /id/2/year/2012/acc-conference">http://espn.go.com/mens-college - 篮球/会议/积分榜// id/2/year/2012/acc-conference使用JSoup提取HTML表格内容

我看到的几个例子并不太清楚如何获取表格的内容。任何人都可以提供任何帮助?

+0

'http:// espn.go.com/mens-college-basketball/meetings/byings // id/2/year/2012/acc-conference'返回404找不到错误:URL你所要求的不存在,但你可能对下面的内容感兴趣。你确定这是正确的网址吗? –

+0

这是错误的网址,它是:http://espn.go.com/mens-college-basketball/conferences/standings/_/id/2/year/2012/acc-conference –

回答

15

你现在可能已经解决了这个问题,但是这将会遍历每个表格并打印出团队名称和Win/Loss列,调整你需要的信息第二个表格显然格式不同,所以如果您需要该表中的不同信息,则需要进一步调整。让我知道你是否需要任何帮助。

Document doc = Jsoup.connect("http://espn.go.com/mens-college-basketball/conferences/standings/_/id/2/year/2012/acc-conference").get(); 

    for (Element table : doc.select("table.tablehead")) { 
     for (Element row : table.select("tr")) { 
      Elements tds = row.select("td"); 
      if (tds.size() > 6) { 
       System.out.println(tds.get(0).text() + ":" + tds.get(1).text()); 
      } 
     } 
    } 
+0

'Elements'是一个打错'Element' –

+1

@DonLarynx答案没有错误。 – Stephan