如何使用Perl在字符串中查找并清除子字符串？

我有一些HTML文件需要编辑。我需要在文件中找到一些值并对其进行清理。如何使用Perl在字符串中查找并清除子字符串？

，比如我有HTML文件：

 
    . 
    . 
    Diagnostics 
     align="right" 
     align="right" 
     align="right" 
     align="right" 
     align="right" 
     align="right" 
     align="right" 

    Configuration 
     align="right" 
     align="right" 
     align="right" 
     align="right" 
     align="right" 
     align="right" 
     align="right" 
    . 
    .

我需要找到和清洁

 
    Diagnostics 
     align="right" 
     align="right" 
     align="right" 
     align="right" 
     align="right" 
     align="right" 
     align="right"

从我的HTML文件。

这是一种简单而快速的方法吗？

谢谢。

来源

2013-02-18 VladB

如果您希望html标记可见，则需要使用Markdown格式将文本设置为代码字段。 – TLP 2013-02-18 14:59:17

查看一个模块，例如HTML::TreeBuilder，用于在Perl中解析HTML。这不是一个非常简单的任务，但链接的文档有一些例子。如果遇到问题，我建议你尝试一下并提出具体问题。其他方法是使用regular expressions。这通常不建议用于解析HTML - 不可能用正则表达式可靠地解析任意的HTML。但是，如果您只是想从具有可预测格式的文件中快速删除某种文件，它可能是一个不错的选择。只要确保你的问题真的如你认为的那样简单，然后再沿着这条路线走。

来源

2013-02-18 15:00:33

如何使用Perl在字符串中查找并清除子字符串？

回答

相关问题