网站www.kissanime.to的“浏览器启用了JavaScript”保护功能,因此当您想要阅读网站的html内容时,这个代码将无法正常工作:从javascript保护的网站中提取HTML代码
HtmlUnitDriver html = new HtmlUnitDriver();
String URL="https://www.kissanime.to/";
html.get(URL);
String pageSource=html.getPageSource();
System.out.println(pageSource);
这工作,但并不是有更好的方法来做到这一点:
URL kissanime = new URL("http://www.kissanime.to/");
URLConnection ks = kissanime.openConnection();
BufferedReader in = new BufferedReader(newInputStreamReader(ks.getInputStream()));
String inputLine;
while ((inputLine = in.readLine()) != null)
System.out.println(inputLine);
in.close();
而且一段时间研究,我发现硒这是一个浏览器库仿真器的后就像Jsoup和Rhino库一样,你将与jsoup建立初始连接然后你将添加犀牛,使它看起来像你有JavaScript或更好,但只有Jsoup和添加一些cookie来绕过保护。
我不会称之为“保护”。他们只是给你一个警告,说他们的网站将无法正常工作,除非你启用了Javascript –
这不是一种保护,这是一种警告,无论如何,我曾经这样做过。 –