2009-12-12 75 views
0

(模糊分组和模糊模糊查找)改造我在SSIS数据转换豆蔻知识,基本上我独自学习所有。问题上的模糊逻辑在SSIS

II已经学会了其中的一些,现在我已经进入了模糊逻辑。

我被陷在Fuzzy grouping and Fuzzy Lookup在SSIS。

我无法弄清楚如何做到这一点,虽然一些谷歌搜索给了我一些结果是超出了我的能力。

任何人都可以请建议我一步一步教程实施相同。

如果示例中包含图表以便我可以轻松学习,那将会很棒。

此外,在这种情况下,我应该去用它(我的意思是实时的场景)提前

感谢

回答

2

这是一个良好的开端,为您真正了解模糊查找组件做什么(类似到模糊分组):SSIS fuzzy lookup

我实际上在客户端接收他们的客户端数据时被某人发过来。我创建了一个基于公司名称的静态查找表:

所需产物表(注意一下这些是相同的开头)

名称|查找输出名称

Microsoft |微软

摩根大通|摩根大通

麦当劳|麦当劳

我会收到一个文本文件,它看起来像这样的数据:

类型化的名称

的Microsft

摩根

McDons

使用模糊查找,我将加入名称列(不要忘记这是区分大小写的用户上限或下限来强制转换)以获取查找输出名称。我将相似度阈值设置为约80%(推荐百分比或更高)。然后我会通过数据查看器查看我的比赛,看起来像这样:

键入的名称|查找名称|自信| Similarity

Microsoft |微软| 100%| 100%

JP摩根|摩根大通| 88%| 90%

McDons |麦当劳| 60%| 50%

然后基于一个条件分割,我将信心和相似度百分比> 80%,小于< 100%的信息加载到查找表中,并将其他信息加载到错误表中。如果错误表中的计数大于1,则会通过电子邮件发送电子邮件。所以结果查询表会是这样的:

查找表

名称|查找输出名称

Microsoft |微软

摩根大通|摩根大通

麦当劳|麦当劳

摩根大通|摩根大通


错误表

名称|建议的名称|错误消息

McDons |麦当劳|信心是60%,相似度是50%

希望这有助于。