2012-03-11 71 views
6

因此,与蟒蛇正则表达式匹配,我们有\ w和其他受re.LOCALE标志的含义是:如何找出哪些字符定义为字母数字对于一个给定的语言环境

\ W

未指定LOCALE和UNICODE标志时,匹配任何 字母数字字符和下划线;这相当于 集[a-zA-Z0-9_]。对于LOCALE,它将匹配[0-9_]加上 ,无论字符在当前的 语言环境中定义为字母数字。

所以我们要找出定义了什么字符的字母数字对于一个给定的语言环境 - 说我们做了“区域-a”,我们有语言环境的列表,并希望找到一个上市一个的信息系统上的语言环境。任何快速查找信息的方法:一个python代码片段或一行代码,shell命令或者某处的参考资料。

回答

5

使用string.letters。

实施例:

>>> import locale 
>>> import string 
>>> locale.setlocale(locale.LC_ALL, 'en_US.UTF-8') 
'en_US.UTF-8' 
>>> string.letters 
'ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz' 
>>> locale.setlocale(locale.LC_ALL, 'de_DE') 
'de_DE' 
>>> string.letters 
'ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz\xaa\xb5\xba\xc0\xc1\xc2\xc3\xc4\xc5\xc6\xc7\xc8\xc9\xca\xcb\xcc\xcd\xce\xcf\xd0\xd1\xd2\xd3\xd4\xd5\xd6\xd8\xd9\xda\xdb\xdc\xdd\xde\xdf\xe0\xe1\xe2\xe3\xe4\xe5\xe6\xe7\xe8\xe9\xea\xeb\xec\xed\xee\xef\xf0\xf1\xf2\xf3\xf4\xf5\xf6\xf8\xf9\xfa\xfb\xfc\xfd\xfe\xff' 
>>> 
+0

感谢。工作得很好。 – 2012-03-11 05:56:07

相关问题