我想解析Html并以字符串形式获取结果。 鉴于外部HTML的主体包含另一个Html字符串,我想要内部Html作为输出字符串。如何解析Html并使用Java将结果作为字符串获取
例子>输入HTML:
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"><html><head></head><body><p><!DOCTYPE html><br /><html><br /><body><br /><br /><h1>My First Heading</h1><br /><br /><p>My first paragraph.</p><br /><br /></body><br /></html><br /><br /></p></body></html>
输出字符串:
<!DOCTYPE html><html><body><h1>My First Heading</h1><p>My first paragraph.</p></body></html>
重要:我使用,其中,如果我输入的东西,它返回的HTML represantation该输入上的HTML编辑器做getText,上面的第一个Html字符串只是表示。
而且输出字符串应该是一样的,当我在这里(http://www.w3schools.com/html/tryit.asp?filename=tryhtml_basic)运行的第一个字符串
请帮助我。
有趣的问题。 – 2015-03-25 13:33:24