我正在创建一个应用程序,它将使我能够从特定网站获取值到控制台。值是从<span>
元素,我正在使用JSoup。Java JSoup错误提取URL
我面临的挑战有此错误的事:
Error fetching URL
这里是我的Java代码:
public class TestSl {
public static void main(String[] args) throws IOException {
Document doc = Jsoup.connect("https://stackoverflow.com/questions/11970938/java-html-parser-to-extract-specific-data").get();
Elements spans = doc.select("span[class=hidden-text]");
for (Element span: spans) {
System.out.println(span.text());
}
}
}
这里是控制台的错误:
Exception in thread "main" org.jsoup.HttpStatusException: HTTP error fetching URL. Status=403, URL= Java Html parser to extract specific data? at org.jsoup.helper.HttpConnection$Response.execute(HttpConnection.java:590) at org.jsoup.helper.HttpConnection$Response.execute(HttpConnection.java:540) at org.jsoup.helper.HttpConnection.execute(HttpConnection.java:227) at org.jsoup.helper.HttpConnection.get(HttpConnection.java:216) at TestSl.main(TestSl.java:19)
什么时我做错了,我该如何解决它?
403 Forbidden错误是一个HTTP状态码,这意味着访问您尝试访问的页面或资源是绝对禁止的。 – ryekayo
那么基本上,我没有办法获取这些数据?也许使用一些替代品?或者是服务器/网站不允许任何HTML Phrasers获取数据? – PICKAB00
不知道该网站是否允许您使用HTML解析器..但最有可能的是,HTML解析器不能使用端口443或80,所以我认为情况并非如此。可能是你执行代码的方式.... – ryekayo