反正比这更容易使用Perl去除字符串中的HTML吗?如何使用Perl去除字符串中的HTML?
$Error_Msg =~ s|<b>||ig;
$Error_Msg =~ s|</b>||ig;
$Error_Msg =~ s|<h1>||ig;
$Error_Msg =~ s|</h1>||ig;
$Error_Msg =~ s|<br>||ig;
我会同时申请一个减肥的正则表达式,例如,是这样的:
$Error_Msg =~ s|</?[b|h1|br]>||ig;
是否有从一个字符串去掉任何/所有HTML现有的Perl功能,即使我只需要加粗,H1标题和BR剥离?
我不会说可能,我会说应该。 试图在正确的时代用正则表达式来消除HTML是荒谬的。 使用来自CPAN的许多HTML清理模块之一,最好是防止XSS漏洞的东西,而不是由Daniel Muey编写。 – 2009-07-02 10:52:04
注意HTML :: Strip不能正确支持UTF-8编码的字符串。请参阅此处了解变通办法https://gist.github.com/910818 – nick 2012-08-08 09:12:43