2017-03-03 133 views
-1

出于研究目的,我需要一个数据库系统。我正在构建一个搜索引擎,它使用两个带有数百万条目的倒排索引和一个包含简单键值条目的索引,其中包含文档的“值”。搜索引擎数据库

一切都在C++中实现并在Windows上运行。它也必须是开源的。到目前为止,在开发中,我将内存中的所有内容加载到内存中,但由于我现在正在转向更大的数据集,所以这是不可能的。

我在想一个面向文档的数据库。不需要大的功能,因为我只做简单的选择和插入,但是性能是一个问题。

我愿意接受任何建议。谢谢

回答

0

如果您使用的是C++,那么您可以尝试通过Xapian构建它。

Xapian是一个高度适应性的工具包,它允许开发人员轻松地将高级索引和搜索功能添加到他们自己的应用程序中。它支持概率信息检索模型,并且还支持一组丰富的布尔查询操作符。