欢同学2023-03-26 09:00:46
关于CARTs,麻烦老师详细看一下我画的图,我把问题列上去了。尤其是节点1、2的基尼系数,我感觉这点的概率应该是以节点0作为基础的条件概率。
回答(2)
ES2023-03-29 10:51:35
同学,你好
很遗憾,我不是你最爱,回答如下:
dividend是一个根部,逻辑上是,希望建立一个模型来预测一家公司是支付股息还是不支付股息(见下方决策树)。
我们最后是需要在Earnings_drop、Large_cap、Retail_investor和Tech四个变量中选择一个变量来向下生成节点,这个节点应该是𝑖𝑛𝑓𝑜𝑟𝑚𝑎𝑡𝑖𝑜𝑛 𝑔𝑎𝑖𝑛最大的
我们捋一捋顺序哈
1. the root node是有无支付股息(dividend)
20家公司中有12家支付了股息,8家没有支付
基尼系数1=0.48
注:这提供了一个base level,我们可以用它(0.48)来比较树木生长时基尼系数的下降,我们要选择基尼系数下降最多的一个。
2. 假设第一个节点选择 earnings drop(earnings drop=1 ,没有 drop=0)
注:见下方蓝色表格
2.1 收益下降(earnings drop=1)的公司中,有6家公司支付了股息(dividend),4家公司没有支付
基尼系数2为:𝐺𝑖𝑛𝑖=1−((6/10)^2+(4/10)^2 )=0.480
2.2 收益没有下降(earnings drop=0)的公司中,有六家支付了股息,四家没有支付
基尼系数3为:𝐺𝑖𝑛𝑖=1−((6/10)^2+(4/10)^2 )=0.480
3. average Gini coefficient
weighted Gini = (10/20)X 0.480 + (10/20) X 0.480 = 0.480
4. 𝑖𝑛𝑓𝑜𝑟𝑚𝑎𝑡𝑖𝑜𝑛 𝑔𝑎𝑖𝑛
𝑖𝑛𝑓𝑜𝑟𝑚𝑎𝑡𝑖𝑜𝑛 𝑔𝑎𝑖𝑛=基尼系数1-weighted Gini= 0.480- 0.480=0
- 评论(0)
- 追问(2)
- 追问
-
哈哈哈,不知道下一个来追答的助教是哪位了。我能看懂ES说的计算思路,我的纠结点之前说过的,就是你在算earings drop 这个node是,为什么概率要用在earning drop =1中挑选有dividend的。为什么不是反过来比如在有dividend 中选有earning drop的?在下一个节点似乎这个节点的信息变成了条件概率中的条件。
- 追答
-
因为dividend是一个根部,是最终的决策,是上面那张图的最下面的那个圈圈
Crystal2023-03-28 10:59:06
同学你好,你思考的很对,我先回答你第一个问题。
这个部分是这样的,你算的部分其实应该算是我选择了一个节点,并且我认为这个节点是OK的,可以继续进行下去之后有的计算,就像你说的应该考虑分红这个节点的条件概率。但是讲义中的部分是我在选了一个节点,判断这个节点是否ok做的计算,即没有考虑分红的部分,因为我发现,单独只考虑这一个节点,此时的gini系数是和dividend一样,两个节点做一个组合,并不能让我知道更多的信息,所以放弃了,也就没有你写的这些步骤。但是如果结果是ok的,顺理成章,下一个步骤就是你写的步骤了。你可以看一下后面选了大盘股的算法,其实就是你写的算法,是我们在先确定了大盘股是ok了之后才会有的计算。
然后是第二个问题,这个权重不是默认50%对50%,是要看dummy=1和dummy=0的比重的。
- 评论(0)
- 追问(1)
- 追问
-
呀,我最爱的crystal来了。开心
但是亲,你看我给你的截图,如果earings drop是完全不考虑上下游关系,就跟dividend一样的计算思路的话,收益下降的公司是10/20,也就是1/2,而不是老师讲的6/10,事实上课件里老师在算这个基尼系数的时候是先从earings drop=1里面再去看dividend=1的,相当于就是个条件概率,只是条件是earings drop。这个就导致我觉得上下游关系不清楚。
评论
0/1000
追答
0/1000
+上传图片




