2012-01-09 83 views
-1

当我们提交网页时,许多字符(如椭圆,引号,长连字符,插文,上标和下标)都将被错误地编码为框和奇怪的文本字符。制作一个正则表达式来检查这些字符。用于检查非转义字符的正则表达式

实际上,当我们提交引号,椭圆或圆点等东西时,它们会显示为网页上的一个大方块,或者它们会被转义出来并成为一串控制字符,如$ & & $。 因此,我们想要查找或检查这些方块,控制序列和其他奇怪的unicode字符类型。

所以我们需要正则表达式来检查所有这些。或者还有其他方式或方法,我们应该遵循。

+0

如果您使用正则表达式来验证文本,请不要尝试验证所有字符。过滤可接受的字符并禁止其他所有内容。 [a-zA-Z0-9_-]加上你想要允许的其他字符,而不是其他字符。 – Barka 2012-01-09 20:53:12

+0

'我们需要做一个正则表达式来检查这些字符。正如@ Veronica所说,这很可能是一个编码问题。尝试在使用正则表达式之前修复它 – 2012-01-09 21:02:53

回答

1

正方形的外观取决于您用来阅读的编码。如果您使用ASCII编码,您将看到正方形而不是字符。

0

如果您想要限制字母数字和数字字符,并且还想让下划线和短划线,您可以替换其他字符或删除它们。

@"[^a-zA-Z0-9_-]" 

这是匹配其不是A到Z,A到Z的所有字符,0到9和一个正则表达式 - ,_。

例如,您可以用下划线替换所有其他字符。

string newStringParsed = Regex.Replace(stringToParse, @"[^a-zA-Z0-9_-]", "_");