我有一个巨大的Wordpress XML导出。不幸的是,一些混蛋设法将代码注入到安装中并将DIV注入到内容中。 现在我想清理那些混乱。这里是什么样子:如何从XML文件中删除具有样式属性的DIV标签?
<p>Normal Text</p>
<div style="position:absolute;top:-9660px;left:-4170px;"><a href="http://insane.link.com">Insane Linktext</a></div>
<div style="position:absolute;top:-2460px;left:-5370px;"><a href="http://insane.link.com">Another Insane Linktext</a></div>
<p>Normal good people's brains' text</p>
我想过使用一些正则表达式表达式匹配包含STYLE属性的DIV。可用的工具是Aptana或其他文本编辑器,PHP服务器以及OSX终端。对此有何建议?
感谢和干杯!
啊,这是正确的做法,发现已经有一些。但标记有时会有所不同,所以我可以只匹配DIV而不是As。我试过'
好吧,我刚刚找到了适合我的解决方案:'
我必须发布关于正则表达式和XML的强制性健康警告http://stackoverflow.com/a/1732454/169346 – JeremyP 2012-04-25 10:06:53