2013-03-14 64 views
0

我是Solr新手,我通过存储在我的数据库中的URL从二进制文件中提取元数据。我想知道哪些字段可用于从PDF索引(将以column =“”启动的字段)。我也想知道如何在Solr中创建自定义字段。这是如何实现并映射到来自文件的特定元数据的。如果有人有一个代码片段,可以告诉我,将不胜感激。 预先感谢您。Solr元数据索引

回答

0

要在Solr中创建自定义字段,您需要修改schema.xml文件以进行Solr安装。随分发包中包含的Solr示例(位于/ example文件夹下)附带的schema.xml文件包含大量用于文件提取的预定义元数据字段。有关创建Solr中的自定义字段的信息,请参阅以下内容:

Solr中有一个内置的请求处理程序提取和二进制文件映射元数据。有关详细信息,请引荐以下几点:

+0

嗨佩奇,非常感谢您的回答。我希望能够在不使用curl命令的情况下进行索引。我的代码被设置为动态索引。您能否给我举一个例子,说明如何提取文件大小,格式或文件类型等内容?与这些类型的字段相关的列名将是什么?此外,我想知道是否有一个如何映射自定义字段的代码片段。我是否必须在solrconfig.xml中声明它,或者在其他地方做一些调整? – Luis 2013-03-14 18:51:14

+0

有关代码示例,请参阅Solr wiki中的此链接 - http://wiki.apache.org/solr/ContentStreamUpdateRequestExample至于列名称,请参考示例并在schema.xml中相应地调整设置,使用上面的链接作为参考。 – 2013-03-14 18:58:34