我与美国合作解决其有不一致的格式,例如,在街道号码:字符串转换为相应的街道号码
358 SEVENTH AVENUE MANHATTAN 10001
我需要它为:
358 7th Ave, New York, NY 10001
使用一个地址解析器像usaddress我可以分离出街道名称:
SEVENTH AVENUE
从此,我就哈ndle问题为:
numbers_mapping = {'seventh':'7th','eight':'8th'}
street_name = 'SEVENTH AVENUE'
street_name = street_name.lower()
for key in numbers_mapping:
if key in street_name.split():
street_name = street_name.replace(key,numbers_mapping[key])
print street_name
7th avenue
我必须用这种方法的问题:
1)首先,我不知道有多少街道号码是有效的,我不想手动创建创建对于似乎很常见的问题,字典太大。
2)处理字符串总是很棘手,我可能会忽略这种方法的一些重要情况。
请尝试此操作,它可能有助于 – IsaBostan