圆同学2022-07-08 23:13:36
多抽取成功的案例??如此人为的干涉某些样本的抽取次数,则不能够反映客观的世界的正常情况,得到一个有偏的结果,这是要自欺欺人吗??
回答(1)
最佳
Essie2022-07-11 18:43:40
你好,当前模型的目的是要预测成功的start-ups,但是在抽样的时候achler发现start-up失败的案例是远远高于成功的案例,achler担心样本类型的不均会对模型的学习造成影响。所以既然已经知道失败的案例远远高于成功,对于这样的样本分布不均,处理的方式可以是:失败的案例既然数量多,那么抽样的时候就少抽一些;成功的案例既然少,那么就多抽取一些作为样本。这里的抽样只是让模型从各个角度分布均匀的去进行学习,分辨失败和成功的start-ups,便于模型的学习,最终才能使模型预测的更准确。
- 评论(0)
- 追问(2)
- 追问
-
这是有偏的抽样,本身破坏了随机抽样的天然规律
- 追答
-
抽样的目的是为了让机器学习,能够判别好成功和失败的start-up,能够在未来做出更好更准确的预测。
如果抽样的时候失败的案例抽了很多,成功的案例抽了很少,机器在“成功的案例”这边能够学习到的样本就少,它就不能完全掌握成功的案例都有哪些特质,这会影响模型学习的结果,也会影响模型最终的预测能力。


评论
0/1000
追答
0/1000
+上传图片