1、这么多变量，为什么选择dividend作为root node？ 2、决策树到底流程步骤是怎样，能起到什么作用，老师课上只提了一句，基尼系数越小越好，至于具体细节说得不够清晰完整，请帮忙重新梳理一下，谢谢。



你还未登录〜

天堂之歌

听歌而来，送我踏青云〜

0元

充值
0橙宝

充值

首页
版块大全

财经学院

CFA FRM CFRM 量化投资

从业资格

证券从业银行从业

会计学院

CPA 会计职称 ACCA CMA 财会求职灌水闲聊

金程考研

公共课 199管综 396经综金融学硕金融专硕经济学硕士会计硕士考研院校考研就业

投资理财

RFP

金融杂谈

金融动态金融八卦吐槽专区

求职招聘

职业发展金融求职职场经验职场修养

研招信息

专业院校热点资讯考研交流考研经验

考研科目

专业课公共课 199管理类联考 396经济类联考

生活日常

运动音乐电影美食交友租房

个人发展
论坛

您现在的坐在位置：首页>智汇问答>FRM问答

13****522023-10-04 16:47:50

1、这么多变量，为什么选择dividend作为root node？ 2、决策树到底流程步骤是怎样，能起到什么作用，老师课上只提了一句，基尼系数越小越好，至于具体细节说得不够清晰完整，请帮忙重新梳理一下，谢谢。

高等数学

回答（1）

最佳

黄石2023-10-07 10:44:30

同学您好。

1. 决策树的构建与信息增益的概念相关。信息增益是一种通过获取关于特征的信息来降低不确定性的度量指标。决策树每一个节点上所选取的特征都应尽量最大化信息增益、最大程度上降低不确定性。不确定性我们使用熵（Emtropy）或者基尼系数（Gini coefficient）衡量，这些指标均落在[0, 1]区间，取值越大不确定性越高，取值越小不确定性越低。在选择第一个节点的变量之前，我们会先计算出一个不考虑任何特征的输出变量的熵/基尼系数，再将已有的变量一个一个套进来试、选择使得熵/基尼系数降低最多的那个变量作为root node。这里倒也不是选用的Dividend，只是画了个示意图；最终最大化信息增益的是Large Cap变量，其使得基尼系数从0.48降至0.255，信息增益 = 0.225。

2. 这个建议同学可以看一下原版书的例题，在每个节点上都是按照上述思想去构建的。这个细节考到的概率很低，同学稍作了解即可。