我正在使用spark.ml渐变提升。生成结果需要将近一天的时间。有没有办法显示进度? (例如,迄今为止生成了多少棵树)spark.ml.gradientboosting的进度报告?
0
A
回答
0
在log4j.properties文件中将缺省日志级别设置为“DEBUG”,或通过修改shell spark.sparkContext.setLogLevel("DEBUG")
中的Spark上下文来设置。这将在树形建造中提供带有状态更新的调试消息,例如,
[DEBUG] 2016-07-31 11:36:23,689 org.apache.spark.ml.tree.impl.GradientBoostedTrees logDebug - ###################################################
[DEBUG] 2016-07-31 11:36:23,690 org.apache.spark.ml.tree.impl.GradientBoostedTrees logDebug - Gradient boosting tree iteration 2
[DEBUG] 2016-07-31 11:36:23,690 org.apache.spark.ml.tree.impl.GradientBoostedTrees logDebug - ###################################################
调试日志记录信息也会显示每次迭代时GBT的错误。
+0
谢谢Seth。我在Spark Standalone上使用Ipython(pyspark)。我在我的笔记本上完成了sc.setLogLevel(“DEBUG”),但我的日志中仍然没有看到任何DEBUG消息。 –
相关问题
- 1. 报告进度
- 2. Directory.GetFiles上的报告进度
- 3. SASL商店进度报告
- 4. BackgroundWorker报告活动进度
- 5. 如何报告JavaScript函数的进度?
- 6. 填写碧玉报告时的进度
- 7. 进度状态报告的模式
- 8. 使用org.eclipse.swt.widgets.ProgressBar报告org.eclipse.core.runtime.jobs.Job的进度
- 9. 定期报告BackgroundWorker的进度
- 10. 如何从ThreadPool.QueueUserWorkItem获取进度报告
- 11. Python Threading:多行进度报告
- 12. 扩展Promise以支持进度报告
- 13. XmlHttpRequest不报告服务器端进度
- 14. BackgroundWorker很酷,但只报告进度
- 15. 向父UI线程报告进度
- 16. 如何报告文件上传进度?
- 17. WPF后台工作报告进度
- 18. 运行一批进程并报告每个进程的进度
- 19. 带进度报告的Stream.CopyToAsync - 即使在复制完成后也会报告进度
- 20. Python多处理:来自进程的进度报告
- 21. 使用java中的图像报告运行任务的进度
- 22. 硬件温度报告
- 23. 速度报告对象
- 24. SQL - 使用报告服务进行报告的存储过程
- 25. 如何报告后台任务的进度?
- 26. 用于进度报告的InputStream或Reader包装器
- 27. 如何使用C#BackgroundWorker报告本地C++代码的进度?
- 28. 多线程任务总体进度报告的设计模式
- 29. 的XMLHttpRequest在谷歌铬不报告进度事件
- 30. 带中心标题的进度4GL报告
不幸的是,除了你可以在火花Web UI中检查的常规任务的进度外,一般不会有什么进展。 – eliasah