2014-11-06 107 views
-2

解析网站时出现问题。 该网站包含这样的一句话:使用jsoup获取标题属性

<td class="school"> 
<abbr title data-original-title="Highschool">...</abbr> 
</td> 

我怎样才能拿到冠军(高中)? 我正在用jsoup和java编程。 感谢您的帮助。

回答

1

试试看jsoup cookbook

首先,你应该得到简称元素,然后将其数据原标题属性:

Element abbrElement = doc.select("abbr").first(); 
String originalTitle = abbrElement.attr("data-original-title"); 

当然,你应该确保你选择正确的简称元素。以上代码将选择出现在文档中的第一个代码。

+0

这就是它 - 感谢您的帮助 – smith 2014-11-06 19:58:46

1

这可以使用jsoup的DOM方法或解析文档上的选择相对容易地完成。看看这些链接以供参考:

DOM navigation

Extracting attributes

//assuming that the class "school" contains the tag for the title 
Elements titles = doc.getElementsByClass("school").getElementsByTag("abbr"); 
for (Element t: titles) { 
    String title= t.attr("data-original-title"); 
    //do something with the title 
}