2010-02-21 201 views
6

我正在构建企业网站的过程中。我们正在寻找任何基于ASP.NET的开源或付费搜索引擎。它应该能够在网站的所有网页的ASP.NET搜索引擎

  1. 搜索网页内容。
  2. 所有办公文件。等等
  3. 如果我们有一些searach重新筛选基于用户类型和样式。

请让我知道我们需要考虑什么样的工具或软件。

回答

7

尝试Lucene.NET

Apache Lucene是一个高性能, 全功能的文本搜索引擎 库完全用Java编写。它 是一种适用于接近 任何需要 全文搜索,尤其是 跨平台的应用程序。

Lucene.Net是一个源代码, 级每级,API的每API和Java Lucene的 搜索引擎的 algorithmatic端口到C#和.NET平台 使用的Microsoft .NET框架 。

这里有教程的一些链接,让你开始:

2

Solr的是另一个不错的选择,它有效地顶上的门面lucene为您提供了一个很好的基于REST/url的API。有一个可用的,成熟的.Net库也可以使用它。

http://lucene.apache.org/solr/

http://code.google.com/p/solrnet/

从你的问题,虽然,你在寻找实际的底层引擎或者是你寻找的东西也抓取/遍历您的内容建立您选择的搜索引擎的索引?

-

编辑回复从原来的海报发表评论。

你有两个等式解决然后。

首先是挑选一个搜索引擎,回应输入(关键字),然后查询其索引,并回报它认为是相关匹配。等式的后半部分是找到一种机制来填充所选引擎的搜索索引。就引擎而言,Lucene已经被提出,并且我提出了一个Lucene的变体,它提供了一个(可以说是)改进的开发接口。就构建搜索语料库而言,这有点不同。在这里,您可以选择编写自己的软件来获取一段内容并将其添加到索引中。这里的优势是你对搜索引擎和什么时候进行了很好的控制。不好的一面是你正在编写新代码 - 幸运的是像Lucene/Solr这样的现代搜索引擎使它变得非常简单。

您的第二个选择是使用某些内容自动抓取您的内容并将其添加到索引。这里的问题在于识别和学习配置适当的选项。根据您选择的抓取工具,它可能会或可能不会很好地对文件系统中的文档建立索引(如在企业Sharepoint站点中说的)。

Nutch是来自Apache(Lucene和Solr的制造商)的爬虫,如果您选择不写自己的代码,可能会使用它。 http://wiki.apache.org/nutch/

+0

我们正在建设一个企业网站。任何访问该网站的人都应该能够搜索所有网页内容。 – user171523 2010-02-21 21:29:58