❤️智慧2024-08-08 11:15:05
老师,题目里面是说Occupancy as the root node. 但是在比较基尼系数的时候,为什么不是让occupancy only 和occupancy + price>80 之间比,而是 price>80和occupancy + price>80 之间比
查看试题回答(1)
黄石2024-08-09 10:10:35
同学你好。这里要计算的是由occupancy带来的信息增益,这等于base Gini(这是在我们对特征一无所知时基于output,也就是price > 80,计算的gini系数) - 通过occupancy来分割得到的gini系数。当然,实际上我们要做的是把每个特征都考虑一遍,分别计算它们作为分割点所能带来的信息增益,选择信息增益最大、分割效果最好的那个(这里就是occupancy了,题目要我们计算它所能带来的具体的增益)。
- 评论(0)
- 追问(0)


评论
0/1000
追答
0/1000
+上传图片