1
A
回答
3
你可以使用
\w+
与Unicode的标志。我假设你的名字没有数字或下划线的风险。
>>> re.findall('\w+', 'Márquez', re.U)
['Márquez']
也似乎问号后失踪P
:(?P<name>[a-zA-Z]+)
0
对于Python < 3,你可能希望启用区域:
import locale
locale.setlocale(locale.LC_ALL, '')
然后用re.LOCALE
选项会regexpes :
re.findall('\w+', 'Márquez', re.LOCALE)
虽然,大概Unicode是更好的路要走,但它需要的数据进行解码和编码它到你的本地编码。
相关问题
- 1. 正则表达式字母数字字符串+特殊字母
- 2. 正则表达式4个字母的特殊字符
- 3. 大写字母,2个特殊字符的正则表达式
- 4. 正则表达式与特殊字符
- 5. 正则表达式的特殊字符
- 6. 特殊字符的正则表达式
- 7. 特殊字符的正则表达式?
- 8. 特殊字符正则表达式
- 9. 正则表达式和特殊字符
- 10. 正则表达式Python字符串忽略特殊字符
- 11. 正则表达式来验证字母数字和特定的特殊字符
- 12. Python中正则表达式中的特殊字符问题
- 13. 正则表达式与Python中的特殊字符不匹配
- 14. 正则表达式考虑字符串中的特殊字符
- 15. 正则表达式允许一个特殊字符(:)和数字和字母只
- 16. 正则表达式:任何字母,数字和0到3特殊字符
- 17. 正则表达式允许字母数字,空格,一些特殊字符
- 18. 正则表达式字母数字和一些某些特殊字符
- 19. Javascript成为正则表达式字母,数字和特殊字符
- 20. JavaScript正则表达式包含字母数字和特殊字符
- 21. 查找与Python正则表达式特殊字符
- 22. 正则表达式在python中为特殊字符
- 23. 正则表达式和正则表达式的特殊字符在JavaScript
- 24. 特殊字符之间的数字的正则表达式
- 25. 排除数字或特殊字符的正则表达式
- 26. 正则表达式的数字,一些特殊字符和NULL
- 27. 正则表达式,以排除特殊字符的名字
- 28. Python正则表达式输入搜索字符串的特殊字符
- 29. 转义正则表达式特殊字符为tr1 ::正则表达式
- 30. Java正则表达式匹配特定的特殊字符
这并不好看的Python <3.0 - 我不喜欢使用与普通(非Unicode)字符串的UNICODE选项的想法。 – 2010-03-09 19:46:21
@Jacek:为什么你非ASCII字符串不是Unicode? – SilentGhost 2010-03-09 19:48:30
在Python 2.x的STR型和“XXXX”文字只包含一个字节的字符串。这些字节可能是特定编码中的某些字符,但是没有编码信息,这些字符只是字节。 '马尔克斯' 是:(77,195,161,114,113,117,101,122)(8个字节),如果您的编码是 'UTF-8' 或(77,225,114,113,117,101,122 )(7字节)如果编码是ISO 8859-1。当在ISO 8859-7中解码时,相同的值将是“Mαrquez”。相同的字节,不同的字符。不知道编码,我们不能谈论Unicode字符。 – 2010-03-09 20:30:47