我想知道,如果我从训练和验证集建立决策树ID3一样,但A是未修剪的效果。 与此同时,我还在ID3中生成了另一个决策树B,它由相同的训练和验证集合生成,但B被修剪。 现在我在未来的未标记测试集上测试A和B,修剪后的树总是会表现得更好? 欢迎任何想法,谢谢。决策树修剪
Q
决策树修剪
3
A
回答
3
,我认为我们需要区分更加清晰:修剪树木总是执行对验证一套更好的,但不一定等等测试集(实际上也是等于或性能差的培训设置)。我假设修剪是在修剪树后完成的(即:修剪后)。
请记住,使用验证集的全部原因是为了避免过度拟合而不是训练数据集,并且密钥这里指的是概括:我们想要一个模型(决策树),它将在“训练时间”提供的实例扩展到新的看不见的例子。
1
0
坏修剪可能会导致错误的结果。虽然减少决策树大小通常是需要的,但通常在修剪时您的目标是获得更好的结果。所以如何是修剪的关键。
0
我同意@AMRO第1个答案。 Post-pruning
是决策树修剪最常用的方法,它在树建立后完成。但是,Pre-pruning
也可以完成。在pre-pruning
中,通过使用指定的阈值,通过提早停止其构建来修剪树。例如,通过决定不在给定节点处分割训练元组的子集。
然后该节点成为一个叶子。这个叶子可以保存元组子集中最频繁的类或这些元组的概率。
相关问题
- 1. 修剪决策树
- 2. 修剪C++决策树
- 3. Python决策树回归修剪
- 4. 决策树问题解决
- 5. 执行决策树
- 6. 决策树组件
- 7. weka决策树java
- 8. 建模决策树
- 9. 决策树在树决策中保持使用Y变量
- 10. 数据库修剪策略
- 11. Weka软件决策树
- 12. 快速排序决策树
- 13. 与sklearn决策树图
- 14. 使用决策树的熵
- 15. 决策树网站示例
- 16. 如何设置决策树
- 17. 机器学习,决策树
- 18. 试图让决策树
- 19. 如何计算决策树
- 20. 多目标决策树
- 21. StackOverflowError决策树生成JAVA
- 22. ID3决策树说明
- 23. Apache Spark决策树预测
- 24. 绘制决策树,graphvizm pydotplus
- 25. 更改树和修剪
- 26. 二叉树的修剪数
- 27. 使用Adaboost时访问和修改OpenCV决策树节点
- 28. 决策树中的决策节点和机会节点定义
- 29. Weka中的修剪和未修剪的树是什么?
- 30. 决策errorbars不matplotlib剪裁与Python
您是否在寻找特定的情况下修剪树可能表现更差? – 2010-10-21 22:05:19