2015-07-10 98 views
-2

我有大约18个缺少文件(文件系统),我在intrenet上搜索到缺少文件系统的文章,请告诉我,如何去做。哪种方法我应该使用dataimport处理程序或solrJ?如何使用Apache索引对文件系统进行索引

+0

你真正想做什么?索引18缺少什么文件? – Prateek

+0

您好@prateek,我有一个fielsystems有18个lac文件,我想索引整个fielsystems使用solr.I有研究文件的solr,我找到了两种方法我们可以索引文件系统DataImporthandler或Solrj –

+0

如果你已经通过solr文档你会知道,对于solr文档你需要有一个文档ID。您需要了解数据的布局并按摩它以符合解决方案的需求。 – Prateek

回答

0

请看看样本数据配置文件在 http://wiki.apache.org/solr/DataImportHandler#FileListEntityProcessor

你需要使用类似XPathEntityProcessor定义 实体进行索引。如果您不使用XML文件,则可以使用其他实体处理器,例如 PlainTextEntityProcessor, 。另外,请确保 您的schema.xml中的字段定义与此处的字段名称 匹配。

+0

谢谢你Godfrey,这完全是我的需求 –

+0

@godrey索引期间,我需要使用一些操作,如提取列,并进行一些操作,如添加一些东西。那么,我将如何使用DIH进行吸吮操作。如果我将使用SolrJ,那么我可以做任何事情,因为我对Java有很好的了解。请帮我解决这个难题 在此先感谢 –