0
我想用Jsoup获取网页的所有超链接。同时,我想忽略所有图像的超链接。是否可以为getElementsByTag添加更多限制?如何获得所有的超链接,但忽略图像的链接
Document doc = Jsoup.connect(url).timeout(1000).get();
links = doc.getElementsByTag("a").not("[src]");
我想用Jsoup获取网页的所有超链接。同时,我想忽略所有图像的超链接。是否可以为getElementsByTag添加更多限制?如何获得所有的超链接,但忽略图像的链接
Document doc = Jsoup.connect(url).timeout(1000).get();
links = doc.getElementsByTag("a").not("[src]");
如果图片是用src
-attribute a
标签链接(而正常链路使用href
)使用此:
Document doc = Jsoup.connect(url).timeout(1000).get();
Elements links = doc.select("a[href]"); // Only select 'a'-tags with 'href' attribute
为jsoup选择API见here。