2010-10-27 1001 views
8

我有一个包含许多地址(60,000-ish条目)的数据集。我想将这些地址分为住宅地址或商业地址。如何检查地址是否是商业或住宅地址

有没有人知道一个好的API /服务开始做这件事?

  • 我不认为谷歌地图geocoder可以在这个时候做到这一点。

  • 联邦快递和UPS都似乎有API的,但他们只发布到被运送产品(有点需要知道的基础上只)

USPS API公司:https://www.usps.com/nationalpremieraccounts/rdi.htm

联邦快递API:http://www.fedex.com/us/developer/web-services/index.html

这是一个爱好项目,所以免费或便宜更好!但付费解决方案并非不可能。

+1

请注意,关于这些东西的唯一真实官方数据来自USPS本身,它仅授权运费比较的数据......所以请记住在潜水前检查条款。 – Matt 2012-07-06 19:39:36

回答

0

看一看的API在http://compass.webservius.com

它的16+万家企业在美国的列表(目标是成为一个完整的商业上市)。如果地址不在那里,很可能是住宅地址。

+0

这看起来非常好,我必须旋转它,我会回发一些代码如果它成功了! – 2010-10-28 21:10:15

+0

终于开始编码了。这个解决方案并没有完全适合我。API非常严格,它需要精确匹配或者确切的前缀与搜索参数相匹配,所以在API结果中找不到很多非住宅地址,这些结果使我的结果偏斜。我也尝试了使用lat,lng(我也有我的数据集)的边界框方法,但结果似乎缺乏。也许我会以错误的方式进行讨论,或者我需要以某种方式规范我的地址。 – 2011-01-21 21:25:29

0

这有点破解,但为什么不写一个脚本来检查地址的第一行是否包含人口普查列表中的任何姓氏?这应该让你获得大部分的住宅地址。假设该人的/企业的名称是您拥有的地址的一部分。

+0

这是一个有点如果John Smith @ blah blah drive会在Smith&Wesson商店的位置上出现的话 – 2010-10-27 20:04:10

+0

这是一个很好的观点,你可以对它进行一些改进,以避免字符不符合' t名字,并寻找名字或先生/夫人/等等和姓氏,但它仍然很不完美 – Swordgleam 2010-10-27 22:12:23

6

如前所述,RDI是一条路。 RDI代表“住宅交付指标”,它会告诉你一个地址是住宅还是商业地址。唯一的问题是你必须是一个开发人员才能使用它你必须拥有标准化和认证地址,更不用说美国邮政数百美元的年度许可费。一旦你得到了它并编写了一个解决方案,你可以给它一个任何旧的ZIP地址,并期望它的工作。地址必须有完整的12位数传送点条形码。

或者您可以使用服务提供商来做同样的事情,并为您的尺寸列表支付约50-100美元。

完全披露:我是SmartyStreets的创始人。我们将RDI纳入我们的产品中,不收取额外费用。这意味着它就像将您的列表拖到我们的网站并在几秒内处理完毕一样简单。我们还提供address verification网络服务API,它将返回住宅/商业指标,让您知道您正在使用的地址类型。

2

Whitepages声称他们让你在他们的API中这样做。对于每天最多20​​0条查询的爱好目的,它是免费的。你会查询分区类型。

地址ID数据结构包含一个“使用”字段,其描述为“仅对美国地址LocationType有效,这表明美国邮政服务对此地址主要是”商业“还是”住宅“的意见。“