1
是否有人知道Ruby的地址解析器插件?Address Parser for Ruby
我可能不得不使用付费的网络服务之一,但认为可能有一个插件。
另一个想法是走下NLP路线,我可以建立一个数据库随着时间的推移。
有没有人使用任何NLP插件的红宝石?
我想用它来解析逻辑和消毒这样的事情从HTML:
<address><strong>HALL (J&E) LTD</strong><br />Head Office<br />
Questor House<br />
191 Hawley Road<br />
Dartford<br />
Kent <br />
DA1 1PU</address>
<p class="tel"><strong>Tel:</strong> +44 (0)1322 223456</p>
<p class="fax"><strong>Fax:</strong> +44 (0)1322 291458</p>
<p><strong>Website:</strong> <a target="_blank" href="http://www.jehall.co.uk">www.jehall.co.uk</a></p>
<p><strong>Email:</strong> <a href="mailto:helpline@jehall.co.uk?subject=Enquiry%20from%20Defence%20Suppliers%20Directory&cc=defenceenquiries@armedforces.co.uk">helpline@jehall.co.uk</a></p>
</div>
任何建议欣然表示赞赏。
这有一个好处,你可以验证地址实际存在(在大多数情况下),特别是如果你有邮政或邮政编码 – bjg 2010-07-08 12:42:56
我认为这是我的默认方式,如果有没有什么开箱的。它有很多意义。它只是降低成本。 – dagda1 2010-07-08 14:04:33
这种解决方案不适用于某些边缘情况,例如,由于地址是新的或省略的,因此Google没有将其编入索引。 – 2012-05-02 16:50:37