我们有一列用于街道地址:
枫树道123号 第1大街321号 等。。。
有什么办法可以将这些地址匹配到给定的输入?输入的内容为街道地址,但格式可能不同。例如:
枫树路123号 第一大街321号
我们的第一个想法是剥离所有街道术语(rd,st,ave,blvd等)的输入。
显然,这不会一直可靠地匹配。还有其他方法可以尝试在SQL Server中匹配街道地址吗?
我们可以使用用户定义的函数,存储的proc和常规的旧t-sql。我们不能使用clr。
为了进行正确的街道地址匹配,您需要将地址转换为标准格式。在这里看看USPS的邮政标准(我假设您正在处理美国地址)。如果您希望能够处理所有类型的美国邮件地址,这绝非易事。您可以使用QAS和Satori Software等公司提供的软件来进行标准化。您需要导出地址,通过软件运行它们,然后使用更新的地址加载数据库。也有第三方供应商也将执行地址标准化。这可能对您尝试做的事情来说是过大了,但这是执行此操作的最佳方法。如果数据库中的地址是标准化的,则将有更好的机会匹配它们(尤其是如果您也可以标准化输入)。