2011-06-17 70 views

回答

26

研究Hadoop或MapReduce可能是一项艰巨的任务,如果您在开始时弄脏手。
我跟着时间表如下:

  1. 开始与MR的非常基本与 code.google.com/edu/parallel/dsd-tutorial.html code.google.com/edu/parallel/mapreduce- tutorial.html
  2. 然后前往 www.cs.washington.edu/education/courses/cse490h/08au/lectures.htm 前两场讲座介绍MapReduce和Hadoop的一个很好的课程。
  3. 阅读开创性的论文 http://research.google.com/archive/mapreduce.html及其更新版本 http://www.cs.washington.edu/education/courses/cse490h/08au/readings/communications200801-dl.pdf
  4. 改进,然后去在上面给出的U.Washington链接的其他所有视频。
  5. 尝试youtubing条款的Map Reduce和Hadoop来查找ORielly和谷歌圆桌视频Hadoop的和MapReduce
  6. 未来的很好的概述,然后关闭的最重要的视频 -
    Cloudera的影片
    www.cloudera。 COM /资源/?媒体=视频

    谷歌MiniLecture系列
    code.google.com/edu/submissions/mapreduce-minilecture/listing.html

除了机智^ h所有的多媒体上面,我们需要良好的书面材料
文件:在hadooper.blogspot.com

  1. 架构图是件好事,对您的墙壁
  2. 的Hadoop权威指南去多进螺母和螺栓整个系统中,作为 Hadoop在行动是一个很好的阅读与大量的教学示例来学习hadoop的概念。 临Hadoop是不适合初学者Apache的文档
  3. PDF文档基金会
    hadoop.apache.org/common/docs/current/
    和 hadoop.apache.org/common/docs/stable/
    将帮助您将了解如何将您的问题建模到MR解决方案中,以便总体上获得Hadoop的优势。
  4. HDFS paper by Yahoo!研究也是一个很好的阅读,以深入了解hadoop
  5. 订阅Commons,MapReduce和HDFS的用户邮件列表,以便了解问题,解决方案和未来的解决方案。
  6. 尝试专家路径http://developer.yahoo.com/hadoop/tutorial/module1.html链接初学者Hadoop的

任何疑问...
联系了Apache,谷歌,必应,雅虎

3

你的问题看起来过于宽泛 - 为了在查看源代码时获得资源,你应该缩小你想要学习的内容。这将使您(以及SO上的任何人)更容易找到涵盖该主题的论文/主题。

我已经挖了几次Hadoop源码。通常我需要了解一个非常具体的课程。在这些情况下,并不是真的需要外部资源,并且因为我有类名,所以我只是为此寻找资源。

如果我要开始尝试理解更高级别的hadoop源代码,我会得到源代码和Hadoop: The Definitive Guide的副本,并将其作为参考以了解源代码的更高级别连接。

我不会声称这将是一个完美的解决方案。 H:TDG比我的其他hadoop书更具技术性,我发现它的内容非常丰富。 H:TDG是我开始的,当我发现我想深入挖掘的领域时,我会开始寻找那些具体的东西。