2012-02-17 865 views
16

我已经得到了一些工作代码,但我需要有人来帮助解释为什么它可以工作!正则表达式只允许字母数字,逗号,连字符,下划线和分号

如果它不是az,AZ,0-9,逗号,分号,下划线或连字符(最终应代表单个用户名或一个用户名),则使用PHP替换字符串中的任何内容逗号/分号分隔的用户名列表)。

以下工作:

$data = preg_replace('/[^,;a-zA-Z0-9_-]/s', '', $data); 

但以下不会:

$data = preg_replace('/[^a-zA-Z0-9_-,;]/s', '', $data); 

为什么会这样,只有当逗号和分号是在开始工作?把它们放在最后似乎会破坏事情(这是我在遇到/ [^ a-zA-Z0-9 _-]/s时最初尝试过的东西

另外,我还使用以下内容修剪任何尾随分号(复数)或逗号(复数),有人可能能够提出更有效的和/或优雅的方式来做到这一点?:

if(preg_match('/;$/', $data)) 
{ 
    $data = rtrim($data, ';'); 
} 
if(preg_match('/,$/', $data)) 
{ 
    $data = rtrim($data, ','); 
} 

感谢所有帮助:)

回答

27

这不是导致问题的逗号和分号;这是连字符。看看你的性格类的各个部分,并考虑他们的意思:

0-9 # Anything from '0' to '9', meaning 0, 1, 2, ... 9 
A-Z # Anything from 'A' to 'Z', meaning A, B, C, ... Z 
_-, # Anything from '_' to ',', meaning...uh...hmmm. 

有没有明确的进展,从_,,所以正则表达式引擎是不知道该怎么利用这一点。在字符类中,如果希望字面解释连字符,它需要在类的开头或结尾(或用反斜线转义)。所以,任何一个将工作:

[^,;a-zA-Z0-9_-] 
[^-,;a-zA-Z0-9_] 
[^a-zA-Z0-9_\-,;] 

至于修去年底,你可以做到这一切在一个正则表达式替换:

$data = preg_replace('/[^,;a-zA-Z0-9_-]|[,;]$/s', '', $data); 
+0

_“从_ 'to',''_ _:有一个非常明确的进程:它基于Unicode表。然而,在这种情况下,'_'在Unicode表中是_after_',',所以范围是不可能的。 – Xufox 2015-10-27 21:40:34

+0

@Xufox - 恩,那会让它回归,不是吗? ;)关键是没有任何正则表达式引擎可以理解的进程。但是你是对的,(从另一个方向看,这是一个有效的进展)(http://rextester.com/YGC93292),从','到'_'。直到现在我还不知道,谢谢! – 2016-03-14 15:33:26

2

我认为这是重要的连字符的位置 - 必须在开始或结束时作为连字符(文字),否则将用于定义范围。

+0

+1另外请注意,你可以简单地用一个反斜杠在第二种模式中逃脱流氓连字符,它的工作方式与第一种模式相同:''[[[a-zA-Z0-9 _ \ - ,;]]/s'' – rdlowrey 2012-02-17 18:24:13

1

可以逃避连字符,并把它的任何地方在正则表达式这样\-

至于尾随分号和逗号,试试这个/[,;]+$/应该在即使他们是许多最终匹配任何逗号和分号。

相关问题