关于CARTs，麻烦老师详细看一下我画的图，我把问题列上去了。尤其是节点1、2的基尼系数，我感觉这点的概率应该是以节点0作为基础的条件概率。



你还未登录〜

天堂之歌

听歌而来，送我踏青云〜

0元

充值
0橙宝

充值

首页
版块大全

财经学院

CFA FRM CFRM 量化投资

从业资格

证券从业银行从业

会计学院

CPA 会计职称 ACCA CMA 财会求职灌水闲聊

金程考研

公共课 199管综 396经综金融学硕金融专硕经济学硕士会计硕士考研院校考研就业

投资理财

RFP

金融杂谈

金融动态金融八卦吐槽专区

求职招聘

职业发展金融求职职场经验职场修养

研招信息

专业院校热点资讯考研交流考研经验

考研科目

专业课公共课 199管理类联考 396经济类联考

生活日常

运动音乐电影美食交友租房

个人发展
论坛

您现在的坐在位置：首页>智汇问答>FRM一级

欢同学2023-03-26 09:00:46

关于CARTs，麻烦老师详细看一下我画的图，我把问题列上去了。尤其是节点1、2的基尼系数，我感觉这点的概率应该是以节点0作为基础的条件概率。

回答（2）

最佳

ES2023-03-29 10:51:35

同学，你好
很遗憾，我不是你最爱，回答如下：
dividend是一个根部，逻辑上是，希望建立一个模型来预测一家公司是支付股息还是不支付股息（见下方决策树）。
我们最后是需要在Earnings_drop、Large_cap、Retail_investor和Tech四个变量中选择一个变量来向下生成节点，这个节点应该是𝑖𝑛𝑓𝑜𝑟𝑚𝑎𝑡𝑖𝑜𝑛 𝑔𝑎𝑖𝑛最大的

我们捋一捋顺序哈

1. the root node是有无支付股息(dividend)
20家公司中有12家支付了股息,8家没有支付
基尼系数1=0.48
注：这提供了一个base level，我们可以用它（0.48）来比较树木生长时基尼系数的下降，我们要选择基尼系数下降最多的一个。

2. 假设第一个节点选择 earnings drop（earnings drop=1 ,没有 drop=0）
注：见下方蓝色表格
2.1 收益下降（earnings drop=1）的公司中，有6家公司支付了股息(dividend)，4家公司没有支付
基尼系数2为：𝐺𝑖𝑛𝑖=1−((6/10)^2+(4/10)^2 )=0.480
2.2 收益没有下降（earnings drop=0）的公司中，有六家支付了股息，四家没有支付
基尼系数3为：𝐺𝑖𝑛𝑖=1−((6/10)^2+(4/10)^2 )=0.480

3. average Gini coefficient
weighted Gini = （10/20）X 0.480 + （10/20） X 0.480 = 0.480

4. 𝑖𝑛𝑓𝑜𝑟𝑚𝑎𝑡𝑖𝑜𝑛 𝑔𝑎𝑖𝑛
𝑖𝑛𝑓𝑜𝑟𝑚𝑎𝑡𝑖𝑜𝑛 𝑔𝑎𝑖𝑛=基尼系数1-weighted Gini= 0.480- 0.480=0

评论（0）
追问（2）

追问

哈哈哈，不知道下一个来追答的助教是哪位了。我能看懂ES说的计算思路，我的纠结点之前说过的，就是你在算earings drop 这个node是，为什么概率要用在earning drop =1中挑选有dividend的。为什么不是反过来比如在有dividend 中选有earning drop的？在下一个节点似乎这个节点的信息变成了条件概率中的条件。

追答

因为dividend是一个根部，是最终的决策，是上面那张图的最下面的那个圈圈

Crystal2023-03-28 10:59:06

同学你好，你思考的很对，我先回答你第一个问题。
这个部分是这样的，你算的部分其实应该算是我选择了一个节点，并且我认为这个节点是OK的，可以继续进行下去之后有的计算，就像你说的应该考虑分红这个节点的条件概率。但是讲义中的部分是我在选了一个节点，判断这个节点是否ok做的计算，即没有考虑分红的部分，因为我发现，单独只考虑这一个节点，此时的gini系数是和dividend一样，两个节点做一个组合，并不能让我知道更多的信息，所以放弃了，也就没有你写的这些步骤。但是如果结果是ok的，顺理成章，下一个步骤就是你写的步骤了。你可以看一下后面选了大盘股的算法，其实就是你写的算法，是我们在先确定了大盘股是ok了之后才会有的计算。
然后是第二个问题，这个权重不是默认50%对50%，是要看dummy=1和dummy=0的比重的。

评论（0）
追问（1）

追问

呀，我最爱的crystal来了。开心但是亲，你看我给你的截图，如果earings drop是完全不考虑上下游关系，就跟dividend一样的计算思路的话，收益下降的公司是10/20，也就是1/2,而不是老师讲的6/10，事实上课件里老师在算这个基尼系数的时候是先从earings drop=1里面再去看dividend=1的，相当于就是个条件概率，只是条件是earings drop。这个就导致我觉得上下游关系不清楚。