2015-05-14 57 views
0

不知有什么办法可以从这样的代码片段:JSOUP提取多种元素的同时

<div class="container "> 
         <h2 class="job"> 
          <a href="/work/android-developer/madrid/11537332" rel="nofollow" 
          title="job Android Developer" class="job-offer "> 
           Android Developer 
          </a> 
         </h2> 
          <h3 class="company"> 
            <a href="/emp/nbc/133192"> 
             NBC Corp. 
           </a> 
         </h3> 
       </div> 

文本Android developer和一次性NBC Corp.

类似doc.select("h2,h3.p-job-title,p-name-company a[href]");不起作用。我也试过doc.select("h2.p-job-title a[href], h3.p-name company a[href]");

请帮忙!

编辑:我发现使用doc.select("h2.p-job-title + h3.p-name.company");我可以提取所需的东西,但我需要的是h2内容+ h3内容在一行中,我的意思是“Android Developer NBC Corp.”。这样,我得到:

“Android开发者”

“NBC公司”

+1

你为什么不能在连接字符串自己呢? – Timo

回答

2

文本Android developerNBC Corp.在一个镜头?

试试这个:

Elements es = doc.select("div.container"); 

for(Element e:es) 
{ 
System.out.println(e.select("h2").text()+"\t"+e.select("h3").text()); 

} 
+0

@EDMUNDO如果我的代码适合你,请标记它。 – JavaFan