2008-11-18 63 views
1

很久以前,我写了一个样式“规范化”程序来扫描一大堆经典ASP页面的ASP/HTML代码(其中大部分最初是从MS-Word文档生成的,所以自然而然地散布着超炫的样式表和巨大的一次性风格)。风格规范化程序生成了一组最少的样式表和样式以及一个新的“清理过的”asp/html文档,以便清理过的文档产生与原始文件完全相同的渲染输出(通过截图图像比较进行验证)。有没有一个html的CSS规范化工作?

我偶尔会碰到一个这样的程序需求,并且正在写一个用于商业版本的想法。

我的谷歌搜索技巧没有打开任何东西完全一样(HTML:规范化的Perl模块和HTML精简项目似乎只是清理标签)。

所以,我的问题是:

  1. 会出现这样的工具已经,商业或其他?
  2. 如果没有,是否有人真的需要它?
  3. 如果是这样,哪些功能会使它真的值得?

re#3例如,为一组页面收集基本样式表,或者调整所有页面以使用给定的基本样式表;保留经典的asp命令,遵循#includes,保留asp.net嵌入式脚本等。越具体和越多越好。

例子:
旧的HTML瓦特/嵌入式标签

<html><head> 
<title>title</title> 
<style type='css/text'> 
.cls1 { font-family: arial; font-size: 10px; font-weight: bold; } 
</style> 
</head> 
<body> 
<% somefunction() %> 
<div class='cls1' style='font-size:10px;'>test div</div> 
</body> 
</html> 

新的HTML

<html><head> 
<title>title</title> 
<style type='css/text'> 
.cls1 { font-family: arial; font-size: 10px; font-weight: bold; } 
</style> 
</head> 
<body> 
<% somefunction() %> 
<div class='cls1'>test div</div> 
</body> 
</html> 

注意在DIV的风格消失了,因为它是多余的类CLS1

编辑:删除了'杀菌剂'这个词,因为我没有专注于XSS攻击或过滤输入的评论,只是巩固了很多ad-hoc样式和随机CSS类组合成一组最小的连贯样式表。

+0

RE#2:好吧,如果有的话,我一定会看看它! – 2008-11-18 18:20:11

+0

@ [Zachary Yates]:你会寻找什么具体功能? – 2008-11-18 18:25:31

回答

3

好了,我不能肯定地说,这个“作品”的一切描述,但整洁确实比清理标签多一点。

HTML Tidy Configuration Options,尤其是那些与微软的Word(如word-2000

+0

一直以来都是HTML Tidy的粉丝。我有一大堆Word制作的HTML,几年前必须清理干净,而且它非常快捷。 – 2008-11-18 20:46:21

+0

@ [Ken G]:HTML Tidy似乎没有清理style ='...'(参见问题示例)或者至少我无法做到这一点... – 2008-11-18 22:25:16