在我最近的PHP项目中,我需要实现用逗号分隔的标签(可搜索)(类似于本网站或类似于WordPress的)。检测和删除不必要的字符或标签的智能方法是什么?抛开XSS的担忧,首先,如果用户输入HTML(或其他标签)而不是纯文本,我需要清理并提取文本。帮助在PHP中实现标签
例如:
If user inputs <b>sdfasdf</b>, <a href="something">sdfsdfsdf</a>, <sdfsdfsdf
It should strip out all the unnecessary characters and tags and only plain text should be saved in database.
我已经在WordPress尝试过了,它很聪明地弄清楚这个加上仅自动提取文本。
我的问题:
是否有可用于这个任务,我可以在我的项目集成的开源库。我已经做了一些这方面的功课,但* htmlentities(),strip_tags(),HTML净化器*等似乎不适合此任务。或者需要建立自己的图书馆与此结合?
有人可以指导我吗?
谢谢!
为什么'strip_tag'看起来不适合这项任务? – SLaks
,因为它似乎'strip_tag'不能删除不完整或破碎的标签 – Laraveldeep
如果WordPress似乎做你想找的东西,我会建议看看他们如何处理它,并重现类似的方法。 – adlawson