1)在使用Hadoop V2时,我们是否在生产环境中使用Secondary NameNode?
它完全取决于您的生产环境设置。如果您将Hadoop V2与HA一起使用,则您不需要生产中的Secondary NameNode,因为您的Slave NameNode将以最佳方式执行与Secondary NameNode相同的任务。但是如果您的生产设置不利用NameNode HA,则必须使用Secondary NameNode进行点校验。请参阅Understanding Hadoop 2.x Architecture和它的恶魔的更多信息。
2)对于Hadoop的V2,假设我们使用了高可用性和当编辑日志文件主动/被动连接muliple NameNodes越来越庞大,
按我这里是了解你的主要关注“Hadoop V2中的NameNode HA如何管理编辑日志?”
下面是答案:编辑日志管理可以通过仲裁日志管理器(QJM)或NFS共享存储
随着QJM来完成,有魔叫JournalNode(JN)的组活跃的NameNode进行通信。该组不断寻找由活动的NameNode完成的任何更新并保持该状态。 StandBy NameNode不断从JN获取编辑日志更新并维护更新后的editlog文件。
使用NFS共享存储,Active NameNode和StandBy NameNode都可以访问共享存储(即网络文件系统)上的特定目录。在由NameNode完成任何更新的情况下,它将事件记录到共享目录。另一方面StandBy NameNode正在寻找在同一共享目录上的更新,并同时更新编辑日志。
我希望这有助于...
非常感谢您的详细解释。 – avinash