2017-05-24 113 views
0

我给一个HTML文件,我需要的文字将它移动到一个新的文本文件,我将创建。我不知道我是否在正确的轨道上。我应该先把它变成一个文档然后是一个文本文件?我目前的做法是正确的吗?对不起,我是这个初学者,很困惑。转换HTML文件成文本文件

public void parseIntoFile(){ 
    Document docParse = Jsoup.parse("example.html"); 
} 

回答

1

HTML通常用于描述文档,因此它已经是一个文档。你的任务是搜集该文档的描述部分放在一起的文本文件,你选择适合的方式。比如,一个<h1>是一个网页的标题。 <p>包含一个段落文本等等和。

这是部分地在顶部文档类型(DTD)的原因。它描述了文档中的每个元素的“类型”或意义的文档类型定义。