2012-03-10 50 views
1

我已经看到了一遍又一遍,并一遍又一遍又一遍的堆栈溢出是正则表达式是不适合的XHTML。然而我没有看到的是另一种选择。替代正则表达式HTML

大多数文本编辑器都内置在正则表达式搜索和替换,这只是超级好用。那么,除了它不适用于HTML。是否有一些工具或语言用于解析替代XHTML?这将是巨大的,如果你可以说,“发现有类的所有段落标记‘引用’与类的DIV内的‘猴子’,然后添加一个H2标签与‘猴报价’里。

另一个我努力寻找解决方案的例子是找到段落标签中的所有单词,并在它们周围包裹一个SPAN标签(用于逐字高亮显示音频),那种东西

Is there一个工具或语言,是为了这种事情?

+0

在您的“包装一''围绕每一个字”的例子,你会更好做动态在JavaScript中。保持你的标记清洁。 – Ryan 2012-03-10 02:27:39

+0

没有人曾经建议JavaScript? – 2012-03-10 02:28:03

+3

是的,它被称为HTML/XML解析器。这里有很多,取决于你使用的语言/平台。 SO搜索'LanguageX HTML parser',如http://stackoverflow.com/questions/3577641/how-to-parse-and-process-html-with-php – Qtax 2012-03-10 02:30:14

回答

3

如果你有一个很好形成文件,XSLTXPATH可以做你的需要。