2012-11-17 43 views
8

我已经开始使用nutch和solr工作,并且在集成Solr和Nutch时遇到了问题。我跟着这个教程:http://wiki.apache.org/nutch/NutchTutorial后使用: bin/nutch crawl urls -solr http://localhost:8983/solr/ -depth 3 -topN 5 Nutch的显示信息:索引在索引数据库中搜索索引数据库时出错

java.io.IOException: Job failed!

和Solr是显示:

SEVERE: org.apache.solr.common.SolrException: ERROR: [doc=http://nutch.apache.org/] unknown field 'host'

我认为,原因可能是缺少“主机”场$ SOLR_HOME/example/solr/conf/schema.xml,但它在那里。 我会非常感谢您的帮助。

+3

您是否将Nutch架构复制到SOLR? cp $ {NUTCH_RUNTIME_HOME} /conf/schema.xml $ {APACHE_SOLR_HOME}/example/solr/conf/ –

+0

是的,我没有复制过。 – user1831647

+2

检查主机是否在架构中定义。停止Solr。删除数据目录。启动Solr。再试一次。 –

回答

2

在Nutch端更改配置不会影响Solr的模式。您必须在Solr的schema.xml中定义该字段。