我正在将数据从平面文件中提取到SQL Server 2008表中。它包含我需要进行匹配的地址信息,所以我需要清理一些数据。清理SQL Server 2008中的传入字符串字段的有效方法?
我创建了一个通用缩写/术语表及其官方美国邮局对应表,然后创建一个函数,该函数可以接受地址字符串,并使用replace和缩写表中的数据返回已清理的地址字符串。
在导入后在表格上运行UPDATE
,并在地址字段上执行SET
,该函数返回的字符串很好,但速度很慢。我对SQL相当陌生,有没有更好的方法来做到这一点?也许在插入之前在SSIS导入期间?
您是否考虑过在输入数据时从官方数据源验证数据?或者,对于现有数据,只需在导入之前通过清理(或“清理”)服务来运行地址列表它? – Matt 2012-01-23 22:17:52