2010-08-20 70 views
1

我使用这些技术:SQL Server 2005中,ASP.NET MVC,NHibernate的/尖锐的架构,并想挖掘一些文字介绍与一些网页的最终目的基于统计。我有几百万个关键字和几百万个文档,并希望根据这些关键字索引的文档运行一些查询。我已经玩了一下SQL Server的全文索引,但我并没有留下太深刻的印象。所以我想知道Lucene.Net是否可以替代。Lucene.Net,SQL服务器,NHibernate的,ASP.NET MVC

我从来没有使用Lucene.Net却明白,这是一个1:Java版本的1端口。所以我的第一个问题是,是否值得研究'Lucene在行动'这本书 - 前提是Lucene会是正确的'技术'?

谢谢。

最良好的祝愿,

基督教

回答

4

好,

FIRST - 更新的SQL Server。您使用了两代过时的版本,它们在SQL Server中首次实现全文搜索,并且有许多(已知和固定的)缺陷。

二 - Lucene的可能真的是更适合。 SQL主要是一个数据库服务器,全文搜索可以做很多事情,但也有很多限制。

但进入Lucene的确实提供了显著的并发症 - 分布式事务处理备份转复杂得多,因为它们是两个系统。 SQL 2008 R2在这里做得更好(全文索引存储在数据库文件中)。

尽管如此,也小心的性能。如果要并行运行大量查询(可以通过Web应用程序轻松完成),则可能需要一台QUITE HIGH END SERVER。这可能需要多个数据库服务器运行只读复制 - 一些SQL Server比Lucene更容易(如:开箱即用)。

我建议你只是得到Lucene和它玩;)不更需要大量的。

+0

谢谢。我读到2008年的sqls会好得多,但钱是问题所在。我可以得到开发者版本,但如果事情是基于网络的许可证会花费很多。你认为在lucene中讨论的事情在行动(Java)帮助我处理lucene.net?这也是一个研究项目,所以我们不会期望成千上万的“客户”,所以只要查询能够在合理的时间内产生结果,我就很开心。 – cs0815 2010-08-20 07:48:28

+0

SQL Server 2008网络版的每月处理器价格为15美元/处理器。检查苏丹人民解放军牌照 - “高价”在这方面大多是“对苏丹人民解放军无能为力”) – TomTom 2010-08-20 08:08:19

+0

听起来很好,谢谢。你能回答书上的问题吗? “Lucene在行动”一书是否有用或者是否有其他充分的文件? lucene.net网站似乎没有包含太多的文件... – cs0815 2010-08-20 08:24:59