2013-02-23 81 views
2

我有一个包含数百万美国地址的数据集。我想对此数据集进行地理编码。雅虎拥有最慷慨的利率限制(每天5万美元,对我的目的而言仍然很低),但这已经失效。我不认为有任何API,除非我每天可以处理超过10万个请求,否则将满足我的需求。如何对地址进行地理编码(获取纬度和经度)数百万个地址?

是否有任何简单配置的软件可以从我自己的计算机上下载?

特别是对那些有经验的人来说,会不会 http://www.datasciencetoolkit.org/developerdocs#setup 适合我的需求?

+0

我会从他们的网站上测试一个有代表性的地址样本开始。比较谷歌的结果。如果他们的数据看起来不错,那就去做吧! – flup 2013-02-23 05:32:52

回答

0

每天支持数百万个请求的API会满足您的需求吗?

这样做的服务很少。特别地,SmartyStreets的LiveAddress可以处理这种负载并且实际上是为它构建的。你可以upload files(如Excel或CSV等,如果你有这么多的话,尤其是压缩)或query the API(每个请求可以支持100个地址)。

因此,虽然程序没有下载到您的计算机,但实际上它比本地化的内部解决方案更快,因为它可以扩展并且负载很高。 LiveAddress是地理分布的,由RAM驱动服务器提供支持,这些服务器在需要做大量工作时可以启动更多节点。 LiveAddress以handling millions of addresses quickly而闻名(就像在几个小时内)。

我在SmartyStreets工作。我们敢于看到您能够合理查询API的速度有多快,或者上传和处理您的所有列表。 API有plenty of sample code on GitHub,或者您可以(通过编程或手动方式)上传列表文件进行批量地理编码。

+0

超出我的价格范围,但谢谢。 – 2013-02-24 11:43:13