2010-04-09 57 views
1

任何人都可以告诉我,SQL Server 2008是否有办法阻止关键字被索引,这些关键字与将要执行的搜索类型无关?从Sql Server FTS索引中删除不需要的索引关键字

例如,我们已经连接了PDF和Word的IFilter,我们的文档已被正确索引,据我所知。然而,这些文件中有很多数字值,人们不会真正在寻找或带回有意义的结果。这些文件仍在编制索引,并在全文目录中创建大量条目。基本上,我们试图以任何可能的方式优化我们的搜索引擎,并假设所有这些不必要的条目都不能帮助提高性能。我希望我的目录只包含字母关键字。目前的iFilters比我能够在我所能写的时间里工作得更好,但它只是比我需要的多。

这是一些从sys.dm_fts_index_keywords_by_document,我想出来的术语的例子:

$ 1,000, $ 100, $ 250 100, 101, 102, 103, 104, 105, 106, 107, 108, 109, 110, 111, 112, 113, 114, 129, 13.1, 14, 14.12, 145, 15, 16.2, 16.4, 18, 18.1, 18.2, 18.3, 18.4, 18.5

这些是来自相同管理观点的一些例子,我认为这对于保存和搜索是可取的:

以上, 符合ingly, 账户, 加, 此外, 另外, 添加剂

任何帮助将不胜感激!

回答

0

请看这里:Stopwords and Stoplists

的语法是:

CREATE FULLTEXT STOPLIST MyList [FROM SYSTEM STOPLIST] 

ALTER FULLTEXT STOPLIST MyList ADD 'above' LANGUAGE 'English' 
ALTER FULLTEXT STOPLIST MyList ADD 'accordingly' LANGUAGE 'English' 

等。

你也可以通过SSMS管理所有这些 - 它在[Your database] > Storage > Full Text Stoplists

+0

感谢您的支持。我对停用词的理解不正确。我认为它只阻止查询返回这些条款的任何结果,但很高兴看到我错了。那么我会继续这样做。 – Scott 2010-04-11 16:51:48

0

不确定SQL Server 2008,但在2000和2005年,您可以编辑noise文件。见herehere

+0

对于我的问题来说,解决方案适用于SQL Server 2008非常重要,但是我很高兴您为那些仍在SQL Server 2005上的用户指出了这一点。 – Scott 2010-04-11 16:54:05