2008-09-27 58 views
4

简单的问题 - 我有一桶cruddy html页面清理,我正在寻找一个开源或免费的脚本/实用程序来删除任何垃圾并将它们重新格式化为良好的一致代码。任何建议?推荐的HTML格式化程序脚本/实用程序?

如果相关,我通常会在Dreamweaver内部操作HTML - 但通过编辑代码并使用wysiwyg窗口作为预览而非反之亦然 - 因此,Dreamweaver兼容脚本将是一个优点。

回答

21

我不认为它插入到Dreamweaver,但每当我需要HTML清理HTML Tidy是我的家伙

4

我第二HTML整洁去。
我只是想添加它是一个库与各种端口和绑定。因此,它也集成在一些编辑器中,如HTML-Kit或NoteTab,并且它有一个GUI前端。所有这些链接在上面给出的页面中。
还要注意,W3C Markup Validation Service有一个选项“清理HTML清理标记”(在验证结果显示后)。

0

您甚至可以通过HTML整洁缓冲自己现有的HTML到达浏览器之前 - 如果它是一个低流量的网站,那么这将让事情变得整齐,没有任何的努力。

1

Dreamweaver CS3在“命令”菜单项下有一个内置的“清理HTML”选项。但我认为它不如HTML Tidy那么全面。

Adobe site

清理代码

您可以自动删除空标签,合并嵌套字体标签,否则改善杂乱或不可读的HTML或XHTML代码。

有关如何清理从Microsoft Word文档生成的HTML的信息,请参阅打开和编辑现有文档。

  1. 打开一个文档:

    • 如果文档是HTML,选择命令>清理HTML。
    • 如果文档使用XHTML,请选择命令>清理XHTML。 - 对于XHTML文档,清理XHTML命令修复了XHTML语法错误,将标记属性的大小写设置为小写,并且除了执行HTML清理操作外,还为标记添加或报告缺少的必需属性。
  2. 在出现的对话框中,选择任何选项,然后单击确定。 - 注意:根据文档的大小和选择的选项数量,可能需要几秒钟才能完成清理。

删除空容器标签删除具有它们之间没有任何内容的标签。例如,<b> </B >和<字体颜色= “#FF0000” > < /字体>是空标签,但&ly; b >标签在& LTB >一些文本</B >不是。

删除冗余嵌套标签删除标签的所有冗余实例。例如,在代码<b>这就是我想<b>真的</b >想要说</b >,围绕这个单词的b标签真的是多余的,将被删除。

删除非Dreamweaver HTML注释删除所有未被Dreamweaver插入的注释。例如,<! - 开始正文文本 - >将被删除,但<! - TemplateBeginEditable name =“doctitle” - >不会,因为这是一个Dreamweaver注释,它标记了可编辑区域的开始模板。

删除Dreamweaver的特殊标记删除评论认为,Dreamweaver中添加到代码,以允许在模板和库项目进行更新,以自动更新文档。如果在清除基于模板的文档中的代码时选择此选项,则文档将从模板中分离。有关更多信息,请参阅从模板中分离文档。

删除特定标签删除在相邻文本框中指定的标签。使用此选项删除其他可视化编辑器和其他您不希望出现在您网站上的标签插入的自定义标签(例如,眨眼)。用逗号分隔多个标签(例如,字体,闪烁)。

联合收割机嵌套<字体>标签时可能整合了两个或两个以上的字体标签时,他们控制相同范围的文本。例如,<字体大小= “7” > <字体颜色= “#FF0000” >大红色< /字体> < /字体>将改为<字体大小= “7” 颜色= “#FF0000” >大红色< /字体>。

显示登录完成显示警报框,其中包含有关清理完成后对文档所做更改的详细信息。

0

我也推荐HTML Tidy,虽然它不再由Dave Ragett维护,但工具肯定会经常更新。

我使用HTML Trim这是一个win32应用程序来清理一些可怕的自动生成的代码块,我们的一些开发人员打了。

您还可以获取可以集成到Dreamweaver中的命令行版本。

对不起,我不能发布多个超链接 - 仍然是一个n00b在这里。

1

我绝对认为最好的工具是来自Logichammer.com的HTML Formatter。它完全符合你的需求,而且使用简单。值得检查......这家伙甚至在他的网站上有一个视频,显示它使用起来有多容易。我已经使用它两年了,无法忍受它...我得到很多杂乱的代码。

-1

我会推荐vim。您可以使用v格式化代码块来选择块并使用'='缩进代码。

0

我一直在使用Polystyle很久,我很开心。它在格式化规则和成本方面相当灵活,价格在15美元左右。试用版可用。

1

我建议purehtml.in ......它美化HTML,样式和JavaScript代码...