我们公司正在开发一个项目,需要一个包含3000万到5000万行产品数据的数据库。这些行包含需要每秒同时搜索数千次的文本。而且,每次搜索都需要不到一秒的时间才能执行。海量数据库w /全文检索 - Sphinx,Lucene,Cassandra,MongoDB,CouchDB
因此,总而言之,我们有一个50M的行数据库,需要每秒搜索数千次。请记住,这些是全文搜索。我知道MySQL或任何关系数据库本身不能处理这种类型的工作。因此,我们正在寻找能够为我们设计正确设置的人员,并帮助我们以您指定的价格实施。
首先,我们想知道我们最好的选择是什么。我个人一直在研究诸如狮身人面像,Lucene,Cassandra,MongoDB,CouchDB,Solr等等,但是真的不知道应该用哪一个与另一个结合使用,以便为我们提供最有效的设置。
因此,如果任何人都可以提供一些建议,或接受我们的工作机会,将不胜感激。
您可以通过PM在这里与我联系,我会给你我的电子邮件/ IM /电话号码以便进一步讨论。
谢谢!
嘿, 感谢您的答复!是的,我忘了提及他们是全文搜索。我关闭MySQL的原因是因为表锁定。全文功能需要myisam,它锁定了表,并因此伤害了我们每秒需要执行的数千个并发搜索。而且,全文搜索比其他选择更慢。我希望将MySQL与Sphinx配对可以解决这两个问题,但我不确定,这就是为什么我在这里发布:) 再次感谢! – 2010-08-15 04:24:57