天堂之歌

听歌而来,送我踏青云〜

您现在的坐在位置:首页>智汇问答>CFA二级

圆同学2022-07-08 23:13:36

多抽取成功的案例??如此人为的干涉某些样本的抽取次数,则不能够反映客观的世界的正常情况,得到一个有偏的结果,这是要自欺欺人吗??

回答(1)

最佳

Essie2022-07-11 18:43:40

你好,当前模型的目的是要预测成功的start-ups,但是在抽样的时候achler发现start-up失败的案例是远远高于成功的案例,achler担心样本类型的不均会对模型的学习造成影响。所以既然已经知道失败的案例远远高于成功,对于这样的样本分布不均,处理的方式可以是:失败的案例既然数量多,那么抽样的时候就少抽一些;成功的案例既然少,那么就多抽取一些作为样本。这里的抽样只是让模型从各个角度分布均匀的去进行学习,分辨失败和成功的start-ups,便于模型的学习,最终才能使模型预测的更准确。

  • 评论(0
  • 追问(2
评论
追问
这是有偏的抽样,本身破坏了随机抽样的天然规律
追答
抽样的目的是为了让机器学习,能够判别好成功和失败的start-up,能够在未来做出更好更准确的预测。 如果抽样的时候失败的案例抽了很多,成功的案例抽了很少,机器在“成功的案例”这边能够学习到的样本就少,它就不能完全掌握成功的案例都有哪些特质,这会影响模型学习的结果,也会影响模型最终的预测能力。

精品推荐

评论

0/1000

追答

0/1000

+上传图片

    400-700-9596
    (每日9:00-21:00免长途费 )

    ©2025金程网校保留所有权利

    X

    注册金程网校

    验证码

    同意金程的《用户协议》
    直接登录:

    已有账号登录