纱线存储关于完成应用的信息,包括hdfs上的运行时间?我只是想通过hdfs上的某些文件(如果确实存在这样的文件,我已经检查了日志并且没有运行时信息)来获取应用程序运行时,而不使用任何监视软件。如何在hadoop纱线上获得应用运行时间
回答
您可以使用ResourceManager REST来获取所有Finished应用程序的信息。
http://resource_manager_host:port/ws/v1/cluster/apps?state=FINISHED
A GET
对URL的请求将返回一个JSON响应(也可以获得XML)。必须为每个应用程序解析elapsedTime
的响应才能获取应用程序的运行时间。
要查找持续作业历史记录文件,你将需要检查作业历史Server或时间轴Server而不是资源管理器:
工作历史汇聚到HDFS,并可以从作业历史服务器中可以看出UI(或REST API)。历史文件存储在HDFS上的
mapreduce.jobhistory.done-dir
上。作业历史记录也可以由时间轴服务器(基于文件系统,又名ATS 1.5)进行聚合,并且可以从时间轴服务器UI(或REST API)中看到。历史文件存储在HDFS上的
yarn.timeline-service.entity-group-fs-store.done-dir
上。
由于我使用shell脚本在纱线上运行多个应用程序,如果我可以设置纱线以在应用程序完成时自动返回应用程序的信息?这是否意味着如果没有这种自动方法,我必须使用'while循环'来经常要求纱线返回完成的应用程序信息? – YunjieJi
@ 0_1_Life您可以运行'yarn application -list -appStates FINISHED'来获取已完成纱线应用程序ID的列表,同时您维护一个已经有作业历史记录的应用程序ID列表。然后每次,如果发现不在列表中的新ID,请运行例如'yarn logs -applicationId application_1484331408245_0014>/tmp/job_0014.log'来获取并保存日志信息。这有帮助吗? –
- 1. 如何运行Giraph纱线(Hadoop的2.6)
- 2. 在AMAZON EMR上运行纱线应用程序
- 3. 在nixos上使用纱线运行时,elm-make无法编译
- 4. 在纱线上运行火花时参数列表太长
- 5. 在Google应用引擎上运行hadoop?
- 6. NodeManager未在Hadoop纱线中启动
- 7. 用纱线运行react-native init
- 8. 如何获得使用时钟运行时间()函数
- 9. 为什么使用Quicksort获得线性运行时间?
- 10. 如何获得rails 2.3.3应用程序在fastcgi上运行Bluehost
- 11. 如何获得在运行时的WPF
- 12. 纱和Hadoop
- 13. 在亚马逊EMR上用纱线运行sqoop2服务器时出错
- 14. 如何在运行Hadoop时避免OutOfMemoryException?
- 15. 如何在Heroku上运行Rails时获得应用程序名称?
- 16. Hadoop:为distcp指定纱线队列
- 17. hadoop和纱线的Maven依赖关系
- 18. 如何在Java中获得UNIX正常运行时间?
- 19. 如何获得在特定时间运行的查询
- 20. 获取应用程序上次运行时间在android
- 21. 如何在iPhone上的指定时间运行应用程序?
- 22. circleci(v2.0)使用npm时,纱线是运行命令
- 23. 获取线程java的运行时间
- 24. 运行Hadoop应用程序
- 25. 获得程序正常运行时间
- 26. 从RTC获得正常运行时间
- 27. 如何从j2ee中的长时间运行过程获得即时响应?
- 28. 上线时从PayPal获得400响应
- 29. 纱线如何管理hadoop中的额外资源?
- 30. 纱线得到休息API
因为我使用'shell脚本'来在纱线上运行多个应用程序,如果我可以设置纱线以在应用程序完成时自动返回应用程序的信息?这是否意味着如果没有这种自动方法,我必须使用'while循环'来经常要求纱线返回完成的应用程序信息? – YunjieJi
是的,您必须手动提出请求来获取应用程序的状态。当应用程序完成时,纱线提供的计数器包含一些相关信息,但不完全是“经过时间”。 – franklinsijo