2010-08-25 84 views
1

我正在寻找纯粹的Ruby(或Java)解决方案来美化HTML代码。使用Ruby或Java美化HTML代码?

由于Nokogiri和其他HTML解析器需要外部C程序,我目前使用Hpricot来解析HTML。我假设我可以使用Hpricot清理HTML,如果我能想出一个好的算法。如果这已经完成,我不希望重蹈覆辙。

+0

与HTML仍然是一个值得商榷的问题,其中包括专业程序员的Ruby集成看一看这个[红宝石论坛](HTTP。: //www.ruby-forum.com/topic/1457449)。 – zearth 2011-08-04 02:59:36

回答

1

也许你可以试试jtidy?

http://jtidy.sourceforge.net/

“JTidy是HTML整洁,一个 HTML语法检查和漂亮 打印机的一个Java端口。就像它的非Java表弟, JTidy可以作为 工具清理格式不正确和错误的HTML。 此外,JTidy提供了一个DOM 接口是 被处理,从而有效地 使你能够使用JTidy的DOM解析器 现实世界的HTML文档。

JTidy是由Andy Quick编写的,后者 后来从维护者 的位置下台。现在,JTidy由一组 志愿者维护。

上JTidy更多信息可在JTidy SourceForge项目页面 上找到 “