2012-02-10 69 views
2

我有一个狮身人面像搜索索引,并希望找到我的索引中最常见的单词。 理想情况下,有按频率排序的单词列表。狮身人面像搜索/ MySQL找到最常用的单词

如果使用Sphinx无法做到这一点,有没有办法查询MySQL表的文本字段以获得相同的统计数据?

回答

5

是的。这很简单。用索引器使用--buildstops和--buildfreqs 标志构建它们。

indexer --config /path/to/sphinx.conf indexName --buildfreqs --buildstops freq_wordlist.txt 100000 

这个例子让你在你的狮身人面像索引中的第100000字由它的频率排序

+0

看起来很简单。谢谢。 – applechief 2012-02-12 14:29:44

0

与使用--buildstops和--buildfreqs标志索引建立他们。

请注意,这不是从现有索引构建,而是像索引一样针对数据源运行,并建立词频。它不会影响索引本身。

如果您使用增量索引保存上次索引文档的ID,则会读取上次保存的ID并从此处开始工作。