决策树
决策树算法思想
决策树简介

- 核心思想:将特征看作一系列条件,通过数据学习这些条件划分方式
- 决策过程:依次考察重要特征,不满足条件则直接输出结果,满足则继续考察其他特征
决策树的构建
- 节点类型:
- 分支节点:表示判断条件
- 叶子节点:表示预测结果
- 分支:条件判断结果
- 构建过程:
- 特征选择:选择对目标值影响最大(分类能力最大)的特征,作为根节点,次大的特征作为分支节点
- 决策树生成:按照特征重要性分层构建,重要特征靠近树根
- 决策树剪枝:决策树容易过拟合,剪枝来缓解过拟合
[!note] 剪枝策略:
决策树结构过于复杂,导致对训练集过拟合,剪枝一般要从深层节点去剪切,可以简化树结构,提高树的泛化能力
常见决策树
ID决策树
信息熵
C4.5决策树
CART决策树
CART回归树
决策树剪枝
案例
参考资料
本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来源 LinHao's Pages!


