Hej!国家数据:根据字典更名为熊猫
我正在对国别统计数据进行一些数据分析。我现在使用来自不同来源的数据,并且很快就会看到,有些国家会有不同的呼叫方式:世界银行称它为“英国和北爱尔兰”,世界卫生组织称之为“英国”,意思是相同的政治建构(我意识到英格兰,苏格兰和威尔士是“国家”,而不是英国)。
我创建了一本字典,我把大部分不同的名字都标准化为世界银行数据。这在列表中的作用就像一个魅力,但我需要它在一个熊猫DataFrame中,我从pd.read_csv
得到。 在例如:如果我有一个很短的字典
dict = {'US': 'USA'}
我怎么可以在我的数据框(在df.country
列设置为dict.key
值)内翻译呢?
显示它例如在:
ID country val
1 US some values
到:
ID country val
1 USA some values
对于我的表转换我用下面的结构,其中listB
是输入和输出列表:
for key in dict:
listB = [w.replace(key, dict[key]) for w in listB]
任何建议如何最容易地做到这一点?任何帮助都是极好的!
P.S:还有一点需要注意的是,有没有人知道如何生成ISO 3166-1 alpha-3编码(如德国= GER,瑞典= SWE等?)。这可能是上述问题的延伸。
等你刮维基百科网页和转换为'dic' – Dark
:)不是那么容易; 0 – jezrael
https://gis.stackexchange.com/questions/1047/full-list-of-iso-alpha-2-and-iso-alpha-3-country-codes可能有帮助 – Dark