老师让我写java来从学校网站上读取html文件并剪切所有不需要的部分(网页中不需要的所有内容),只留下网站中心的公告部分,另存为另一个html文件。如何从网址编辑代码并保存到桌面上的.html文件
我现在可以将html文件读取到java中,但不能编写代码来编辑(剪切不需要的)并另存为html文件。已迄今所做
代码:
import java.io.*;
import java.net.*;
public class Html {
public static void main(String[] args) throws IOException {
URL chula = new URL("http://www.ise.eng.chula.ac.th");
URLConnection yc = chula.openConnection();
BufferedReader in = new BufferedReader(new InputStreamReader(yc
.getInputStream()));
String inputLine;
while ((inputLine = in.readLine()) != null) {
System.out.println(inputLine);
}
in.close();
}
}
}
你是什么意思的“削减不必要的路径”? – DeadlyJesus 2013-04-29 12:39:15
你可以粘贴控制台输出吗?所以我们可以知道你的页面html是如何。 – gnanz 2013-04-29 12:48:01