2010-08-12 99 views
1

我想开发一个搜索引擎,但不知道我可以有效使用的后端。请给我建议一个数据库,我可以在其中存储数千条记录并以高效的方式查询它们。我正在为自己的兴趣开发搜索引擎,所以请不要给我任何类似问题中常见的批评意见。搜索引擎的数据库

Thankyou

+0

全部取决于您正在搜索的内容。 Bono使用的方法显然太慢... http://bit.ly/54Dlbs – RedFilter 2010-08-12 16:20:29

+0

为什么不使用像Lucene或类似的搜索引擎而不是构建一个? – Paco 2010-10-29 15:04:57

回答

2

查看Cloudant,这是Apache的CouchDB的集群/可伸缩部署。 CouchDB是NoSQL计划的一部分(它使用文件系统而不是由数据库服务器提取存储),并被告知可以很好地扩展,特别是在使用Cloudant的情况下,尽管我自己并没有尝试过。

显然,对于任何DODB(面向文档的数据库,就像Apache所说的那样),您将不得不从单独的内存和表索引转移到包括存储容量,尽管使用文件系统意味着您通常能够使用较少的内存(因为较少的信息被存储在内存中)。这是一个广泛的概括,但你明白了。

1

对于成千上万的记录,标准的rdbms就足够了。对于数百万甚至更高的人来说,你可能想要寻找替代品。

但是既然你是为了你自己的利益而做这件事,那么就去做一件让你明白不同的事。

1

MySQL and 全文索引是一个很好的解决方案,可以搜索数千条记录。当你放大并接近100万行时,MySQL全文变得很慢,你将不得不使用另一种方法,如Sphinx