天堂之歌

听歌而来,送我踏青云〜

您现在的坐在位置:首页>智汇问答>FRM一级

欢同学2023-03-26 09:00:46

关于CARTs,麻烦老师详细看一下我画的图,我把问题列上去了。尤其是节点1、2的基尼系数,我感觉这点的概率应该是以节点0作为基础的条件概率。

回答(2)

最佳

ES2023-03-29 10:51:35

同学,你好
很遗憾,我不是你最爱,回答如下:
dividend是一个根部,逻辑上是,希望建立一个模型来预测一家公司是支付股息还是不支付股息(见下方决策树)。
我们最后是需要在Earnings_drop、Large_cap、Retail_investor和Tech四个变量中选择一个变量来向下生成节点,这个节点应该是𝑖𝑛𝑓𝑜𝑟𝑚𝑎𝑡𝑖𝑜𝑛 𝑔𝑎𝑖𝑛最大的

我们捋一捋顺序哈

1. the root node是有无支付股息(dividend)
20家公司中有12家支付了股息,8家没有支付
基尼系数1=0.48
注:这提供了一个base level,我们可以用它(0.48)来比较树木生长时基尼系数的下降,我们要选择基尼系数下降最多的一个。

2. 假设第一个节点选择 earnings drop(earnings drop=1 ,没有 drop=0)
注:见下方蓝色表格
2.1 收益下降(earnings drop=1)的公司中,有6家公司支付了股息(dividend),4家公司没有支付
基尼系数2为:𝐺𝑖𝑛𝑖=1−((6/10)^2+(4/10)^2 )=0.480
2.2 收益没有下降(earnings drop=0)的公司中,有六家支付了股息,四家没有支付
基尼系数3为:𝐺𝑖𝑛𝑖=1−((6/10)^2+(4/10)^2 )=0.480

3. average Gini coefficient
weighted Gini = (10/20)X 0.480 + (10/20) X 0.480 = 0.480

4. 𝑖𝑛𝑓𝑜𝑟𝑚𝑎𝑡𝑖𝑜𝑛 𝑔𝑎𝑖𝑛
𝑖𝑛𝑓𝑜𝑟𝑚𝑎𝑡𝑖𝑜𝑛 𝑔𝑎𝑖𝑛=基尼系数1-weighted Gini= 0.480- 0.480=0

  • 评论(0
  • 追问(2
评论
追问
哈哈哈,不知道下一个来追答的助教是哪位了。我能看懂ES说的计算思路,我的纠结点之前说过的,就是你在算earings drop 这个node是,为什么概率要用在earning drop =1中挑选有dividend的。为什么不是反过来比如在有dividend 中选有earning drop的?在下一个节点似乎这个节点的信息变成了条件概率中的条件。
追答
因为dividend是一个根部,是最终的决策,是上面那张图的最下面的那个圈圈

Crystal2023-03-28 10:59:06

同学你好,你思考的很对,我先回答你第一个问题。
这个部分是这样的,你算的部分其实应该算是我选择了一个节点,并且我认为这个节点是OK的,可以继续进行下去之后有的计算,就像你说的应该考虑分红这个节点的条件概率。但是讲义中的部分是我在选了一个节点,判断这个节点是否ok做的计算,即没有考虑分红的部分,因为我发现,单独只考虑这一个节点,此时的gini系数是和dividend一样,两个节点做一个组合,并不能让我知道更多的信息,所以放弃了,也就没有你写的这些步骤。但是如果结果是ok的,顺理成章,下一个步骤就是你写的步骤了。你可以看一下后面选了大盘股的算法,其实就是你写的算法,是我们在先确定了大盘股是ok了之后才会有的计算。
然后是第二个问题,这个权重不是默认50%对50%,是要看dummy=1和dummy=0的比重的。

  • 评论(0
  • 追问(1
评论
追问
呀,我最爱的crystal来了。开心 但是亲,你看我给你的截图,如果earings drop是完全不考虑上下游关系,就跟dividend一样的计算思路的话,收益下降的公司是10/20,也就是1/2,而不是老师讲的6/10,事实上课件里老师在算这个基尼系数的时候是先从earings drop=1里面再去看dividend=1的,相当于就是个条件概率,只是条件是earings drop。这个就导致我觉得上下游关系不清楚。

精品推荐

评论

0/1000

追答

0/1000

+上传图片

    400-700-9596
    (每日9:00-21:00免长途费 )

    ©2026金程网校保留所有权利

    X

    注册金程网校

    验证码

    同意金程的《用户协议》
    直接登录:

    已有账号登录