2016-09-06 110 views
1

我想从链接http://ica-ap.coop/AboutUs/association-asian-confederation-credit-unions-accu提取数据的Java jsoup HTML

我尝试使用此代码提取文本“银行和信贷”:

Document doc = Utils.getFromURL("http://ica-ap.coop/AboutUs/association-asian-confederation-credit-unions-accu"); 

    Elements e = doc.select("div.field-items div.field-item.even table[width=523]");  

    Element ab = e.select("thead tr td p").first(); 

    System.out.println(ab.text()); 

但它dosnt工作。

有什么想法吗?

+0

的文本不是在'thead',但在'tbody' ... – PeterMmm

+0

“但它dosnt工作。”不足以正确描述问题。请[编辑]你的问题,并包括特定的问题描述,如错误消息/异常堆栈跟踪/预期与实际结果。 – Pshemo

回答

0
Document doc = (Document) Jsoup.connect("http://ica-ap.coop/AboutUs/association-asian-confederation-credit-unions-accu").get(); 
    Elements e = doc.select("div.field-items div.field-item.even table[width=523]");  

    Element ab = e.select("tbody tr:nth-child(1) p").last(); //content is tbody not thead 

    System.out.println(ab.text());