我无法使TagSoup正常工作。我使用的是后面的代码,但是当我打印由解析器返回的节点(带有System.err.println(doc);的行)时,我总是得到“[#document:null]”。使用tagsoup构建DOM文档
我不知道如何找到这个代码中的错误,或者,无论它是什么,问题的根源。请帮忙!
public final Document parseDOM(final File fileToParse) {
Parser p = new Parser();
SAX2DOM sax2dom = null;
org.w3c.dom.Node doc = null;
try {
URL url = new URL("http://stackoverflow.com/");
p.setFeature(Parser.namespacesFeature, false);
p.setFeature(Parser.namespacePrefixesFeature, false);
sax2dom = new SAX2DOM();
p.setContentHandler(sax2dom);
p.parse(new InputSource(new InputStreamReader(url.openStream())));
doc = sax2dom.getDOM();
System.err.println(doc);
} catch (Exception e) {
// TODO handle exception
e.printStackTrace();
}
return doc.getOwnerDocument();
}
我读过那个文档,但是我没有意识到Document是Node的一个子接口 - 现在我有了大局,谢谢 – cdarwin 2010-11-02 17:29:20