2012-08-14 58 views
0

可能重复:
Allow user submitted HTML in PHP试图删除span标签与动感的风格属性

我建立一个小工具,发表网络文章到我们的网站。我们的用户很多时候都直接从Microsoft Word中复制和粘贴到我的wysiwyg编辑器中。编辑器复制所有Word隐藏标签。

我想解决的主要问题是删除<span>。 Word在<span>标签后经常会引入很多风格属性。例如:<span style=" Arial, sans-serif; font-size: 10pt; ">

有没有办法删除整个span标签?正则表达式?

+1

用DOM解析它。正则表达式不适用于HTML,因为HTML不是常规语言。 – Matt 2012-08-14 14:35:20

回答

1

如果你设置使用正则表达式它,你可以尝试像

"/^(<span)+([A-Za-z0-9=,;:])*(>)+$/" 

(<span)+(>)+渔获都开始和结束标记和中间部分应该抓住任何属性声明为内联。然后你可以使用php preg_replace用空引号或类似的东西替换这个模式的所有事件。

http://www.php.net/manual/en/function.preg-replace.php