2008-12-18 173 views
3

我想用正则表达式在字符串中查找英国邮政编码。Python,正则表达式邮政编码搜索

我已经拿到了正则表达式中使用RegexBuddy工作,见下图:

\b[A-Z]{1,2}[0-9][A-Z0-9]? [0-9][ABD-HJLNP-UW-Z]{2}\b 

我有一大堆的地址,并希望从他们,下面的例子抢邮编:

123的一些路名
镇,市

PA23 6NH

如何w ^我可以在Python中谈论这个吗?我意识到Python的re模块,但我努力让它工作。

干杯

EEF

+0

您应该检查:http://www.govtalk.gov.uk/gdsc/schemas/bs7666-v2-0.xsd 特别是“(GIR 0AA )|((([AZ-[QVX]] [0-9] [0-9])|(([AZ-[QVX] [AZ-[IJZ]] [0-9] [0-9 ])|(([AZ-[QVX]] [0-9] [A-HJKSTUW])|([AZ-[QVX] [AZ-[IJZ]] [0-9] [ABEHMNPRVWXY])) ))[0-9] [AZ- [CIKMOV]] {2})“为标准正则表达式 – nicodemus13 2008-12-18 15:25:03

回答

5

重复您的地址与邮编PA23 6NH,PA2 6NH和PA2Q 6NH 3倍测试你的图案,并使用正则表达式从对你的维基百科,代码..

import re 

s="123 Some Road Name\nTown, City\nCounty\nPA23 6NH\n123 Some Road Name\nTown, City"\ 
    "County\nPA2 6NH\n123 Some Road Name\nTown, City\nCounty\nPA2Q 6NH" 

#custom                                    
print re.findall(r'\b[A-Z]{1,2}[0-9][A-Z0-9]? [0-9][ABD-HJLNP-UW-Z]{2}\b', s) 

#regex from #http://en.wikipedia.orgwikiUK_postcodes#Validation                        
print re.findall(r'[A-Z]{1,2}[0-9R][0-9A-Z]? [0-9][A-Z]{2}', s) 

结果是

['PA23 6NH', 'PA2 6NH', 'PA2Q 6NH'] 
['PA23 6NH', 'PA2 6NH', 'PA2Q 6NH'] 

这两个正则表达式给出了相同的结果。

+0

由于我清楚我会修改正则表达式:'[AZ] {1,2} [\ dR] [\ DA-Z]? \ d [AZ] {2}' (\ d而不是[0-9],如果你的意思是“一个数字”,最好直接说出来。) – PEZ 2008-12-18 16:08:02

0

尝试

import re 
re.findall("[A-Z]{1,2}[0-9][A-Z0-9]? [0-9][ABD-HJLNP-UW-Z]{2}", x) 

你不需要\湾

0
#!/usr/bin/env python 

import re 

ADDRESS="""123 Some Road Name 
Town, City 
County 
PA23 6NH""" 

reobj = re.compile(r'(\b[A-Z]{1,2}[0-9][A-Z0-9]? [0-9][ABD-HJLNP-UW-Z]{2}\b)') 
matchobj = reobj.search(ADDRESS) 
if matchobj: 
    print matchobj.group(1) 

输出示例:

[[email protected]]$ python uk_postcode.py 
PA23 6NH