我有一个网站,用户可以使用自定义的TinyMCE实现发布的东西(如在论坛,评论等)。他们中的很多人喜欢从Word复制&粘贴,这意味着他们的输入通常会伴随大量关联的MS内联格式。PHP清理粘贴微软输入
我不能摆脱<span whatever>
,因为TinyMCE依赖span标签进行一些格式化,我不能(也不想)强制用户使用TinyMCE的“从Word粘贴”功能(这似乎并不能很好地工作)。
任何人都知道图书馆/类/功能,将为我照顾这个?这一定是一个常见问题,尽管我找不到任何明确的答案。我最近一直在想,寻找特定于MS的模式的一系列蛮力正则表达式可能会诀窍,但我不想重写一些可能已经可用的东西,除非我必须这样做。
另外,修正卷曲引号,em-dashes等会很好。我现在有我自己的东西来做这件事,但我真的只想找到一个MS转换过滤器来统治它们。
谢谢,但这些都不符合MS格式,这是我主要感兴趣的.HTML Purifier已计划使用3.5版本,但需要“必要的研究”。 – da5id 2008-12-18 21:48:06