2017-08-09 110 views
0
<div id="divEvents"> 

    <ul class="News_Title_Link"> 

    <li style="line-height:20px"><a href="/article/us-asia-storm-japan-idUSKBN1AO09Y" title="Now a tropical storm, Noru rakes Japan's main island">Now a tropical storm, Noru rakes Japan's main island</a> (21/03/2017 12:11)</li> 

    <li style="line-height:20px"><a href="/article/us-southkorea-military-idUSKBN1AO0C9" title="South Korea's Moon taps Air Force chief to head Joint Chiefs of Staff">South Korea's Moon taps Air Force chief to head Joint Chiefs of Staff</a> (18/03/2015 17:16)</li> 

我使用jsoup获取日期和时间,例如:“2017/3/21 12:11”,但输出结果是“韩国月球水龙头空军司令担任参谋长联席会议主席(17/03/2017 17:16)“。Java使用jsoup在html中获取文本标签

这里是我的代码

Document doc = Jsoup.connect(url).get(); 
Element time = doc.select("li").get(1); 
String text = time.text(); 

任何人的帮助可以修复代码即可获得唯一的日期和时间。

谢谢。

+1

也许你想要['time.ownText()'](https://jsoup.org/apidocs/org/jsoup/nodes/Element.html#ownText--)so作为不获取子元素的文本? – Glenn

+0

谢谢。 time.ownText()的作品。 –

回答

2

尝试,以获得所选择的<li>元素的文本使用time.ownText()同时排除的<li><a>子元素的文本。

+0

谢谢格伦。它现在有效。 –

0

Element time = doc.select(“li”)。get(1); 而不是使用1,而不是0。 //这将选择第一个标签

+0

我想获得时间而不是整个文本,所以我找出正确的代码是time.ownText()。无论如何,谢谢你的回答。 –