2011-08-26 64 views
4

我想知道一个名字在美国的受欢迎程度,最好是排名,但是这个名字的人数也会很多。给定名称受欢迎程度的API

The Social Security Administration keeps records of baby names going back to 1879。可能有一种方法可以确定人群中某个名字的总体频率,但我会考虑在给定年份中获得某个名称的排名,并将其用作受欢迎程度的(有缺陷)代理。

这是可能的,通过their site,所以我想像只是解析正确的POST请求的结果会做到这一点。

目前我只是运行:

curl -d "year=2010&top=1000&number=p" http://www.ssa.gov/cgi-bin/popularnames.cgi > 2010_top_1000.html 

然后解析HTML,做生成的文件中查找。

有没有更好的方法来做到这一点?

更新: 最可以用上述方法得到的名字是1000,您可以作为一个zip文件在这里超过5名的频率让婴儿名字的整个列表:http://www.ssa.gov/oact/babynames/limits.html

回答