2012-03-28 163 views
2

我试图与索引“阿帕奇Nutch的1.4”当我运行下面的命令,会出现以下错误站点“java.io.IOException异常:作业失败”产生java.io.IOException:作业失败

bin/nutch solrindex http://localhost:8983/solr/ crawl/crawldb -linkdb crawl/linkdb crawl/segments/* 

我安装 “Tomca6” 和 “Apache Solr实现3.5.0” 使用Nutch的工作,但遗憾的是没有工作

模拟

[email protected]:/usr/share/nutch/runtime/local$ bin/nutch solrindex  http://localhost:8983/solr/ crawl/crawldb -linkdb crawl/linkdb crawl/segments/* 
SolrIndexer: starting at 2012-03-28 18:45:25 
Adding 48 documents 
java.io.IOException: Job failed! 
[email protected]:/usr/share/nutch/runtime/local$ 

谁能帮米请问?

+0

你有一个日志文件的异常的堆栈跟踪? – jpountz 2012-03-28 22:49:58

+0

我把一块日志放在下面的链接上供你看... [Hadoop.log](https://raw.github.com/gist/2231654/564d7bf5a59262ee9bd63f5a6434e68d822156fb/hadoop.log) – Agutoli 2012-03-29 00:02:54

+1

@Agutoli I'd建议您查看您的solr日志文件,以便了解从Solr获取的BadRequest错误的原因。你可以在这里粘贴相关部分吗? – javanna 2012-03-29 08:13:48

回答

0

如果nutch结果字段到Solr字段的映射不正确或不完整,通常会发生此错误。这会导致Solr服务器拒绝“更新”操作。不幸的是,在调用链的某个时候,这个错误被转换成了一个有点误导性的“IO错误”。我的建议是访问Solr服务器的Web控制台(可以使用与链接副本相同的URL进行访问,例如http://some.solr.server:8983/solr/),然后转到日志选项卡。有关映射的错误将显示在那里!

相关问题