Q

Sklearn RandomForestClassifier predict_log_proba除以零误差

2017-09-04 72 views 0 likes

0

我想为一个nlp问题使用RandomForestClassifier，但是当我使用predict_log_proba方法时，我得到一个除零错误。我看了一下predict_proba方法的结果，发现其原因是因为某些类（总共有6个类）的某些概率为0.因此，当predict_log_proba试图将np.log应用于0时，它会得到一个错误。有没有一个参数可以避免这个问题？Sklearn RandomForestClassifier predict_log_proba除以零误差

我知道predict_log_proba可以正确地使用一个随机森林分类，因为我看到这个示例代码使用它，它工作得很好：http://scikit-learn.org/stable/auto_examples/calibration/plot_calibration_multiclass.html

我使用sklearn版本0.19和RandomForestClassifier的默认参数值。

2017-09-04 PretentiousPanda

A

回答

2

那么如果你的模型输出给定类的零概率，那么这个类的对数概率就是负无穷。所以，如果你总结了日志空间中的概率（或者需要这个值），那么显然你不能使用它。

为了在随机森林中发生这种情况，它意味着所有的树都同意该特定数据点的特定类别的概率为零。你可以通过增加树数来减轻这种影响（这会增加其中至少有一个人说这个例子属于这个类的机会）。或者您可以减少参数max_depth，以达到类似的效果。

或者，您可以在应用对数之前软化模型的输出，例如将输出概率乘以0.99并加上0.01。

希望有所帮助。

2017-09-04 21:40:19 nlml

相关问题

1. Sklearn：如何Feed数据，以sklearn RandomForestClassifier
2. 差异ROC-AUC分数sklearn RandomForestClassifier与
3. 除以零误差
4. TSQL除以零误差
5. RandomForestClassifier的性能差
6. T-SQL 2005 - 除以零误差遇到
7. 除以零误差在.xml文件
8. 计算频率时除以零误差？
9. 除以零误差（存储过程）
10. 分零误差
11. VB.net零误差
12. SWRevealViewController零误差
13. 的FileInputStream零误差
14. SQL除以零错误
15. Informix除以零错误
16. RandomForestClassifier（sklearn）的predict_proba（X）似乎是静态的？
17. Numpy的标准差方法给零除误差
18. sklearn RandomForestClassifier活动路径或结束节点
19. 的Grails：房产零误差
20. msvc除以零
21. ScalaFiddle除以零
22. SSRS除以零的错误表达
23. 解决除以零错误在SQL SELECT
24. SSRS报告中除以零错误
25. 没有安装错误Sklearn的graphviz的
26. 浮点除以零
27. 检查除以零
28. AWK除零错误
29. 为什么我画图遇到除零误差？
30. 在我的函数上获得除零误差