Apache Spark是否提供API来获取类似于scikit-learn的predict_proba函数(即decision_tree.predict_proba(X))的决策树预测概率?Spark - Prediction Probability API(predict_proba)
3
A
回答
-1
1
我自己寻找这一点。当我注意到api具有非常尴尬的功能时(至少对于LogisticRegressionModel
),我差点破解了一个解决方案:
您清除了阈值(使用clearThreshold()
)。这样预测功能不会返回标签,而是返回底层的价值。
Java docs这样说:
公共LogisticRegressionModel clearThreshold() ::实验::清除阈值,使得预测将要输出的原始预测分数。
仅供参考:返回值介于0和1之间,默认阈值为0.5,因此您可以轻松评估要设置阈值的内容。
相关问题
- 1. Sklearn - predict_proba等效
- 2. TypeError for predict_proba(np.array(test))
- 3. Google Prediction API总是返回1.0或0.0的分数
- 4. AlamoFire请求Google Cloud Prediction API iOS解析错误
- 5. 与谷歌应用程序引擎谷歌Prediction API进行
- 6. Google Apps脚本上的Google Prediction API的最新版本请
- 7. 回归与分类器predict_proba
- 8. 始终概率:predict_proba,sklearn
- 9. Spark Streaming Statistics的API
- 10. spark将spark-SQL转换为RDD API
- 11. scikit-learn/svm - 在'predict_proba'后获取概率和相关标签
- 12. Spark写DataFrame出jdbc错误
- 13. 阅读和学习Spark API?
- 14. Spark Datastax Java API Select语句
- 15. 使用spark-kernel comm API
- 16. 如何扩展apache spark api?
- 17. Spark-Streaming Kafka Direct Streaming API&Parallelism
- 18. 获取对应的类predict_proba(GridSearchCV sklearn)
- 19. Keras分类器predict_proba()不符合预测()
- 20. TensorFlow Estimator 1.3无法获得predict_proba?
- 21. RandomForestClassifier(sklearn)的predict_proba(X)似乎是静态的?
- 22. 将自定义字段添加到Spark ML LabeldPoint
- 23. xgboost4j - spark评估需要RDD [(Double,Double)]
- 24. Spark在写入CSV时如何处理矢量值?
- 25. Spark中逻辑回归模型的areaUnderROC计算
- 26. reduceByKey()api获取关键点spark
- 27. Spark Dataframe的计数替代品()API
- 28. Dataproc:通过REST API提交Spark作业
- 29. 使用spark运行pyspark脚本REST API
- 30. java.lang.NoSuchMethodError:org.apache.spark.streaming.api.java.JavaDStream.foreachRDD(Lorg/apache/spark/api/java/function/Function;)V
谢谢。我只能看到得到布尔预测的能力,而不是预测概率。我错过了什么吗? – user2701815 2014-12-19 20:25:40