天堂之歌

听歌而来,送我踏青云〜

您现在的坐在位置:首页>智汇问答>CFA二级

YW2023-12-01 08:06:02

老师例子里:node 算出来的消费的平均值 意义是什么呢? 如果最终terminal node的还是每个数据自己的消费值, 那第一次分类的平均值21000 列出来的感觉毫无意义

回答(1)

爱吃草莓的葡萄2023-12-01 13:48:45

同学你好。在CART(Classification and Regression Trees)模型中,如果是回归问题,CART模型在每个叶节点计算的是目标变量的平均值(期望值),这是因为在训练过程中,模型会试图找到一个决策边界,使得目标值在每个叶节点上的平均值最小。换句话说,CART模型是通过最小化每个叶节点上的目标值方差来逼近真实函数,这就有点像在线性回归中学到的OLS回归思想。

此外,使用平均值作为每个叶节点的预测也是一种简化处理,这样做可以避免模型在处理复杂数据时过度拟合。通过使用平均值,CART模型可以构造一个更简单、更鲁棒的模型。

当然,这并不是说CART模型只能使用平均值作为每个叶节点的预测。在某些情况下,其他类型的预测指标(例如中位数等)可能更适合回归问题。然而,平均值是最常见和最直观的选择,因为它可以提供一个全局的、平均的观点,而不会过度关注任何特定的数据点。

  • 评论(0
  • 追问(0
评论

精品推荐

评论

0/1000

追答

0/1000

+上传图片

    400-700-9596
    (每日9:00-21:00免长途费 )

    ©2026金程网校保留所有权利

    X

    注册金程网校

    验证码

    同意金程的《用户协议》
    直接登录:

    已有账号登录