你能推荐一个全文搜索引擎吗? (最好是开源的)你能推荐一个全文搜索引擎吗?
我有一个很多(尽管相对较短)的HTML文档的数据库。我希望用户能够通过在我的C++桌面应用程序中输入一个或多个搜索词来搜索此数据库。因此,我正在寻找一种快速的全文搜索解决方案来整合我的应用程序。理想情况下,它应该:
- 跳过常用词,如
the
,of
,and
等 - 支持所产生的,即搜索
run
还发现含有runner
,running
和ran
文档。 - 随着新文档添加到数据库中,能够在后台更新其索引。
- 能够提供搜索字词建议(如谷歌建议)
- 有一个证据充分的API
为了说明,假设数据库中只有两个文件:
文件1:
This is a test of text search.
文档2:
Testing is fun.
下列词语应该在指数:fun
,search
,test
,testing
,text
。如果用户在搜索框中键入t
,我希望应用程序能够建议test
,testing
和text
(理想情况下,应用程序应该能够从t
开始查询搜索引擎中的10个最常见搜索词)。搜索testing
应该返回这两个文档。
其他景点:
- 我不需要多用户支持
- 我并不需要进行复杂查询
- 数据库驻留在用户的计算机上支持,所以索引应该是在本地执行。
你能提出一个基于C或C++的解决方案吗? (我简要回顾了CLucene和Xapian,但我不确定是否会解决我的需求,尤其是查询搜索词索引的建议功能)。
注意:这不是免费的。 – 2010-06-06 08:55:00