2013-02-18 87 views
0

我有一些HTML文件需要编辑。 我需要在文件中找到一些值并对其进行清理。如何使用Perl在字符串中查找并清除子字符串?

,比如我有HTML文件:

 
    . 
    . 
    Diagnostics 
     align="right" 
     align="right" 
     align="right" 
     align="right" 
     align="right" 
     align="right" 
     align="right" 

    Configuration 
     align="right" 
     align="right" 
     align="right" 
     align="right" 
     align="right" 
     align="right" 
     align="right" 
    . 
    . 

我需要找到和清洁

 
    Diagnostics 
     align="right" 
     align="right" 
     align="right" 
     align="right" 
     align="right" 
     align="right" 
     align="right" 

从我的HTML文件。

这是一种简单而快速的方法吗?

谢谢。

+1

如果您希望html标记可见,则需要使用Markdown格式将文本设置为代码字段。 – TLP 2013-02-18 14:59:17

回答

2

查看一个模块,例如HTML::TreeBuilder,用于在Perl中解析HTML。这不是一个非常简单的任务,但链接的文档有一些例子。如果遇到问题,我建议你尝试一下并提出具体问题。其他方法是使用regular expressions。这通常不建议用于解析HTML - 不可能用正则表达式可靠地解析任意的HTML。 但是,如果您只是想从具有可预测格式的文件中快速删除某种文件,它可能是一个不错的选择。只要确保你的问题真的如你认为的那样简单,然后再沿着这条路线走。

相关问题