我想知道是否有任何Hadoop计数器和作业可视化库/项目。例如,显示每个作业类型和开始和结束时间的时间显示,随时间绘制。另一个例子是随着时间的推移绘制一个给定的计数器。我认为这可以用于运营洞察力,监控和警报。Hadoop计数器可视化
回答
注:由于这是我的第一篇,所以我不能发表超过两个URL。请看看this GitHub gist for my post with all links in Markdown format。下面所有的斜体都是超链接。抱歉给你带来不便。 - 迈克尔
我现在想到的唯一的开源可视化项目是Twitter Ambrose。从我在这个回复中提到的各种工具中,你可能会首先看看安布罗斯。它支持在其网站UI以下功能:
[安布罗斯网络用户界面的特征]
- 所有相关的作业的表图,其当前状态
- 和弦和图形图来沿可视化的工作依赖关系和当前状态
- 的总体脚本进度条
除此之外,我的个人经验来自商业供应商的产品。为了他们的名字,但二:
- Cloudera的经理为CDH4分布
- MAPR的Dashboard为M3和M5分布
两种产品都带有一个API,允许你扩展它们并将它们与您自己的Ops工具集合在一起。 Cloudera Manager需要一个评估许可证,而MapR的仪表板可以在免费的M3发行版中使用,如果你想旋转它的话。像往常一样,每个人都有优点和缺点。
这就是说,你还可以配置标准的Hadoop来发送其指标的监控工具,如神经节(见现场演示在UC伯克利电网)。基本上,您只需将度量值转储到Ganglia中,后者将处理各种度量标准的可视化/绘图。 描述了如何将Ganglia配置为小型Hadoop集群。如果您正在运行Hadoop 2.x,请看什么是Hadoop Metrics2以了解下一代Hadoop中的度量系统的工作方式。
尽管与直接问题有点不相关,但您也可以通过调用Hadoop的Java API来编写自定义监视器。通常可以直接使用与其他Ops基础结构工具兼容的方式编写这些自定义显示器,例如Nagios。例如,我们的一个自定义监视器连接到JobTracker,以便检测运行时间超过24小时的任何MapReduce作业(这在99%的故事中表明作业以某种方式破裂)。根据您将指标转储到您的工具,您将获得免费的可视化图形(参见上面的Ganglia示例)。
希望这会有所帮助, Michael
- 1. 可视化来自hadoop的xml数据
- 2. 可视化地理信息在hadoop
- 3. Hadoop计数器文档?
- 4. JSF的可视化设计器
- 5. Asp.net的可视化设计器
- 6. HTML/JSP可视化设计编辑器
- 7. PHP与可视化设计器的IDE?
- 8. 可视化ASP.NET MVC设计器
- 9. 数据集可视化器
- 10. kibana可视化上元素的计数
- 11. 使用Hadoop可视化大型数据集
- 12. 基于浏览器的可视化编辑器/设计器?
- 13. var_export美化器/可视化器
- 14. 序列化Hadoop中 - 可写
- 15. 如何在Hadoop中获取计数器
- 16. 了解Hadoop文件系统计数器
- 17. hadoop中有120多个计数器
- 18. Hadoop色调:计数器结果灰显
- 19. 可视化数据
- 20. 数据可视化
- 21. 可视化数据
- 22. Java声音可视化器
- 23. jasmine.JUnitXmlReporter报告可视化器
- 24. 可视化编辑器eclipse
- 25. 可视化的浏览器
- 26. Python可视化调试器
- 27. eclipse可视化编辑器
- 28. eclipse可视化编辑器
- 29. 音频可视化器C#
- 30. 可视化WADL编辑器