的原贴张贴在https://stackoverflow.com/questions/6007097/design-question-for-notification-system的通知系统设计问题
这里是进一步澄清的问题:通知系统的目的就是要通知用户(通过电子邮件现在)时,该网站的内容已被更改或更新或新的发布。这可以被视为一个通知系统,人们为第三方网站定义一个规则或关键字,并且通知系统出去爬取第三方网站并创建搜索倒排索引。然后,一个新的链接或文档显示为用户定义的关键字或规则(底部关于用例的更多解释),
澄清使用的案例:假设我是craigslist用户并正在寻找二手车。我定义了一个规则“本田协议”,“年”1996年和价格范围从“2000美元到3000美元”。
对于上面的用例来说,什么是最佳方法,以及如何利用Apache Lucent,Apache Solr和Apache Nutch等开源技术以及Apache Hadoop来解决此用例。 您可以建立搜索引擎的东西,并与规则和关键字通知系统。我只是需要一些指针,并帮助如何整合这些开源软件包来解决用例问题?
任何帮助和指针将不胜感激。我们需要三个重要组件:
1) Web Crawler 2) Index Creator 3) Rule or keyword Mather
任何帮助将不胜感激。我指的是这个将Nutch和Solr集成在一起的维基,用于上述目的http://wiki.apache.org/nutch/RunningNutchAndSolr
这是一个非常广泛的要求,而不是容易回答的问题。我建议你想出一些更具体的具体问题。你是否开始实施这个系统?你有任何特定的技术要求(即只使用java,mongodb等)? – 2011-05-15 21:15:03