我想从HTML文件中的文本在Java检索HTML文件中的文本在Java中
我html
文件是:
<body>
<p>vishal</p>
<strong>patel</strong>
<bold >vishal patel
我要输出这样
vishal
patel
vishal patel
如何要做到这一点,请帮助我
我想从HTML文件中的文本在Java检索HTML文件中的文本在Java中
我html
文件是:
<body>
<p>vishal</p>
<strong>patel</strong>
<bold >vishal patel
我要输出这样
vishal
patel
vishal patel
如何要做到这一点,请帮助我
最好使用HTML解析器....我喜欢使用JSoup解析器(OpenSource包)文本....
import org.jsoup.Jsoup;
public class HTMLUtils {
public static String extractText(Reader reader) throws IOException {
StringBuilder sb = new StringBuilder();
BufferedReader br = new BufferedReader(reader);
String line;
while ((line = br.readLine()) != null) {
sb.append(line);
}
String textOnly = Jsoup.parse(sb.toString()).text();
return textOnly;
}
public final static void main(String[] args) throws Exception {
FileReader reader = new FileReader("C:/RealHowTo/topics/java-language.html");
System.out.println(HTMLUtils.extractText(reader));
}
}
你可以使用xml解析器 – 2012-03-09 09:15:54
你想从网上的一个html文件中读取它,比你应该使用下面的教程http://docs.oracle.com/javase/tutorial/networking/urls/readingWriting .html – 2012-03-09 09:16:17
否则确实使用XmlParser。顺便说一句,你没有结束标签 –
2012-03-09 09:16:29