0

我们的应用程序允许用户输入其组织使用的公司名称。目前的问题是,一个用户输入公司名称的方式因用户而异。我们需要整合这些数据。有解决这个问题的方法吗?合并/群集术语和短语

回答

1

数据质量问题通常被称为数据清理。这方面有很多方法和工具。

最适合你的将取决于你的问题的程度以及你使用的技术。但是如果我理解的很好,那么存储的数据就OK了,问题是用户输入的数据是否与拼写错误一起搜索?在这种情况下,模糊搜索可能有帮助

+0

模糊搜索是有道理的,你有什么建议,至于工具? – Rob 2009-12-22 09:08:56

+0

您正在使用哪种技术? – ewernli 2009-12-22 12:21:04

+0

非常标准的.net/sql堆栈。目前使用全文查询,但这并没有多大帮助。 – Rob 2010-05-06 15:35:15