2009-06-25 84 views
2

我需要开发一个应用程序来索引几个文本,我需要在这些文本中搜索人名。问题是,当一个人的正确名称是“格雷戈里·杰克逊少年”,里面的文字,名字可能我写为:
- 格雷格·杰克逊JR
- Gegory杰克逊JR
- 格雷戈里·杰克逊
- 格雷戈里Ĵ 。初级
我计划在每晚的基础上对文本进行索引,并构建数据库索引以加快搜索速度。我想推荐好的书籍和/或关于这个主题的好文章。
谢谢在文本中识别拼写错误的名字的算法

+0

你的问题是错误的措词。这些例子并不表示拼写错误,而是写入全名的形式发生变化。而且,我很好奇,你的搜索是否希望参照这个例子来匹配“儿子”这样的词? – nik 2009-06-25 14:23:15

+0

其实,其中一个名字也可能拼写错误。我不需要像大三和儿子这样的同义词。 谢谢 – Pascal 2009-06-25 14:30:14

+0

你有没有发现任何要做到这一点? – 2012-02-16 01:20:14

回答

2

你的问题是不正确的措辞。这些例子并不表示拼写错误,而是写入全名的形式发生变化。

而且,

好了,读您的意见建议你不想冒险进入这一点。

1

备案。使用贝叶斯过滤器。您可以使用机械卡车来初始化您的算法。