秦同学2025-10-20 22:28:57
information gain应该是with the help of Large cap - without the help of Large Cap吗?那是不是-0.225? 如何解读
回答(1)
黄石2025-10-21 17:44:36
同学你好。information game指的是在考虑了large cap的帮助之后和考虑了large cap的帮助之前,基尼系数的下降幅度。计算的话,在这道题里就应该是0.48-0.255=0.225。这个0.225的解读要追溯到基尼系数的定义,基尼系数本身衡量的是系统当中的一种不确定性。这个系数越大、不确定性就越高(可以通过一个例子来理解:假设只有两种可能的结果,不确定性最大的时候应是这两种结果发生的概率各为0.5的时候,此时Gini = 1 - 0.5^2 - 0.5^2 = 0.5;不确定性最小的时候应是这两种结果有一种发生概率为1,也就是有一个结果是必然会发生的,此时Gini = 1 - 1^2 - 0^2 = 0)。在这里,考虑了large cap这个特征之后,不确定性下降了0.225。在构建决策树时,每个节点上选择的特征应是该节点上令不确定性下降最多的特征,这有助于我们做出决策。还是举一个极端的例子,比如说只要是large cap就必付股息,反之则必不付股息。此时,Gini = 1 - 1^2 - 0^2 = 0;对于决策而言,这告诉我们,只要看到large cap就无脑认为该公司是支付股息的就行,所以我们此时会最想把该特征放在当前的节点上。
- 评论(0)
- 追问(2)
- 追答
-
同学你好。注意information gain对应着不确定性的下降幅度,所以要用一开始的不确定性水平减去考虑某个特征后的不确定性水平。
评论
0/1000
追答
0/1000
+上传图片

