2010-07-07 64 views
1

有没有人有关于如何为SQL Server 2005创建自定义分词的信息。我宁愿写在C#中。我需要能够搜索诸如'c#','f#'等术语,但'#'字符是英文(英国)字断开器组件中的断字器,不能以任何其他方式进行更改。SQL Server自定义WordBreaker全文

我发现以下文章提供了一个不完整的(IWordSink接口缺失)示例并引用了不再可用的文章。本文也不提供任何我期望看到的线程检查代码。 http://bytes.com/topic/sql-server/answers/864969-custom-wordbreaker-sql-server-full-text

或者,有人可以指示我如何反编译现有的英语分词符'langwrbk.dll',所以我可以做出一点点改变,我需要现有的代码?

感谢

柯克

+0

请阅读[实施断路器和Stemmer](https://msdn.microsoft.com/en- us/library/windows/desktop/ff819112(v = vs.85).aspx)和[Snowball stemmer](http://snowball.tartarus.org/) – 2016-07-17 19:22:55

+0

+ https://stemmersnet.codeplex.com/ – 2016-07-17 19:40:00

回答

3

的技术分词系统和词干分析器是在所有微软的搜索产品,包括SQL Server全文常见。 Search SDK已完整记录,请参阅Extending the IndexWindows Search Developer's Guide

对langwrbk.dll进行反向工程将违反您同意的用户许可证,因为非常明确地规定您不能反向工程,反编译或反汇编软件。更不用说这是代码签名,你将无法'做一点改变'...

+0

是的,Remus你是对的我不应该为所有那些非常好的原因反编译/拆卸dll。当我写我的原始文章时,我只是感到沮丧。 – 2010-07-07 20:33:20