2016-10-04 69 views
2

我想知道nutch服务器在分布式环境中如何工作?无论它是使用监听器接收传入的爬行请求,还是连续运行的服务器?在分布式模式下工作的nutch服务器

+0

FYI:链接到这方面的详细信息:http://www.mail-archive.com/[email protected]/msg14958 .html – Sachin

回答

2

Nutch REST API使用Apache CXF框架和JAX-RS构建。 Nutch服务器使用嵌入式Jetty服务器来处理http请求。

你可以找到更多关于这里CXF和Jetty(http://cxf.apache.org/docs/overview.html

+0

为了说明问题,我的问题是,它是否充当接收到的抓取请求的侦听器并按需触发nutch从节点,或者它是否作为分布式服务器持续运行? – Sachin

+0

我们是否可以在分布式环境中使用Nutch服务器(使用Nutch 1.x发布hadoop)?请回复 – Sachin

+0

它自己的Nutch服务器不是分布式的,它会在一台机器上运行,等待http请求。一旦收到请求,它就会启动相应的Nutch Job请求(这可能是分发的预取作业)。 –

相关问题