不知有什么办法可以从这样的代码片段:JSOUP提取多种元素的同时
<div class="container ">
<h2 class="job">
<a href="/work/android-developer/madrid/11537332" rel="nofollow"
title="job Android Developer" class="job-offer ">
Android Developer
</a>
</h2>
<h3 class="company">
<a href="/emp/nbc/133192">
NBC Corp.
</a>
</h3>
</div>
文本Android developer
和一次性NBC Corp.
?
类似doc.select("h2,h3.p-job-title,p-name-company a[href]");
不起作用。我也试过doc.select("h2.p-job-title a[href], h3.p-name company a[href]");
请帮忙!
编辑:我发现使用doc.select("h2.p-job-title + h3.p-name.company");
我可以提取所需的东西,但我需要的是h2内容+ h3内容在一行中,我的意思是“Android Developer NBC Corp.”。这样,我得到:
“Android开发者”
“NBC公司”
你为什么不能在连接字符串自己呢? – Timo