2011-01-26 91 views
0

我正在做一个涉及设计一个网站的uni项目。我处于开发的早期阶段,只是想澄清我对迄今为止学到的知识的理解。我的网站将包含一个数据库(可能是SQL或Oracle),包含简报,文字和其他一些文件,但主要是这些文件。新手需要帮助 - Lucene

我可以使用Lucene来: 1)使用关键字来查找和检索 2相关的网页)搜索并从数据库中

提取相关的PowerPoint和Word文件,从我收集的核心Lucene搜索我的网站将索引我的网站和数据库,并找到相关的页面和文件。不过,我需要添加其他软件,例如抓取工具和用户界面。

正如我所说我对这件事很陌生,一开始都很复杂,但到目前为止我所收集的结果是否正确?

非常感谢,

菲尔

回答

1

1)您将需要创建一个Lucene索引。

2)一种做法是使用nutch来抓取您的网站,它会返回一个lucene索引,它会将您网站上的所有链接/数据编入索引。

3)我相信你也可以为数据库创建一个lucene索引。