2010-07-08 54 views
1

是否有人知道Ruby的地址解析器插件?Address Parser for Ruby

我可能不得不使用付费的网络服务之一,但认为可能有一个插件。

另一个想法是走下NLP路线,我可以建立一个数据库随着时间的推移。

有没有人使用任何NLP插件的红宝石?

我想用它来解析逻辑和消毒这样的事情从HTML:

<address><strong>HALL (J&amp;E) LTD</strong><br />Head Office<br /> 
    Questor House<br /> 
    191 Hawley Road<br /> 
    Dartford<br /> 
    Kent <br /> 
    DA1 1PU</address> 
    <p class="tel"><strong>Tel:</strong> +44 (0)1322 223456</p> 
    <p class="fax"><strong>Fax:</strong> +44 (0)1322 291458</p> 
    <p><strong>Website:</strong> <a target="_blank" href="http://www.jehall.co.uk">www.jehall.co.uk</a></p> 
    <p><strong>Email:</strong> <a href="mailto&#58;helpline&#64;jehall&#46;co&#46;uk?subject=Enquiry%20from%20Defence%20Suppliers%20Directory&amp;cc=defenceenquiries&#64;armedforces&#46;co&#46;uk">helpline&#64;jehall&#46;co&#46;uk</a></p> 
</div> 

任何建议欣然表示赞赏。

回答

1

您可能会使用Google地理编码服务获得一些成功。这可以返回结构化地址。有宝石与宝石地图API

+0

这有一个好处,你可以验证地址实际存在(在大多数情况下),特别是如果你有邮政或邮政编码 – bjg 2010-07-08 12:42:56

+0

我认为这是我的默认方式,如果有没有什么开箱的。它有很多意义。它只是降低成本。 – dagda1 2010-07-08 14:04:33

+0

这种解决方案不适用于某些边缘情况,例如,由于地址是新的或省略的,因此Google没有将其编入索引。 – 2012-05-02 16:50:37