Phyllis2021-03-11 01:59:52
老师,您看如截图这里。对于boosting, 是如黑字描述的 对于少的观测量给予高权重?(overweight scarcer);还是如周老师红色字写的ABCD例子,给予高的数字高权重 低的数字低权重呢?这里有些矛盾呀。此外,对红字提及的加权平均也不太理解,不知是按什么加权的?
回答(1)
Michael2021-03-11 21:13:10
学员你好,
你看的很仔细,我首先来解释一下这个说法。
这个是原版案例中关于boosting的一个解释,因为案例不是专业的算法书籍,所以他也是通过举例的方式来说明什么叫做boosting的。
书上的例子是说,如果我现在要找一个算法来分辨违约和不违约的信用卡。我找到了一个样本数据,但是里面几乎都是不违约的信用卡,那么这个样本数据没有用处或者用处不大,因为算法的作用是找出违约的信用卡。具体的做法就是增加样本中违约的数量(权重),因为违约的信用卡的数据本来就是稀少的,所以就叫做overweight scarcer。比如说,在模型训练的时候,先将样本的违约率设定为1%,看看模型的辨别效果,然后逐渐升高,看一下模型表现的稳定性,相当于给模型增加难度了。
书本从这个角度和你说明boosting中的加权是怎么做到的,不过这个案例是属于具体问题具体分析啦。
在理解上,boosting的主要思想是将弱模型组装成一个强模型。怎么做呢?有两个核心问题:
1)在每一轮模型训练中改变训练数据的权值。通过提高那些在前一轮被“弱模型”分错样例的权值,减小前一轮分对样例的权值,来使得模型对误分的数据有较好的效果。【这个就是书本上的例子想要表达的】
2)通过一些方法来组合弱模型,变成一个强模型。简单一些可以将弱模型直接进行线性组合,增大错误率小的模型的权值,同时减小错误率较大的模型的权值即可。【这个就是我上课的时候讲解的例子】
希望对你有帮助。
- 评论(0)
- 追问(0)


评论
0/1000
追答
0/1000
+上传图片