阿同学2022-12-16 11:01:55
cluster和stratified的区别;bootstrap和jackknife的区别
回答(1)
Evian, CFA2022-12-22 12:08:07
ヾ(◍°∇°◍)ノ゙你好同学,
这两种抽样方法有什么相同之处?
1
这两种抽样方法都是对总体进行分组。
2
这两种采样方法都使用了简单随机抽样的概念。
这两种抽样方法有什么不同?
1
分层随机样本每阶层的属性一致(同一年级,不能代表总体),聚类抽样每隔聚类集合属性不一致(四个年级都有,可以代表总体)。
2
对于分层抽样,从每阶层中抽取一定数量样本,从而汇总得到总样本。对于聚类抽样,随机抽几个聚类集合。
详细举例:
分层随机抽样
例如,假设我们想了解复旦大学的学生是否支持新建停车场。可能存在的问题的新生的支持程度将不同于高年级的学生。在这种情况下,我们希望获得样本数据(假设n=100)涵盖所有大学四个年级。分层随机样本的步骤如下:
1
以学校所有复旦学生为总体,按年级将他们分成不同的subpopulation(阶层)。在每个阶层中,学生都是相似的属性(同一年级)。
2
每个阶层随机抽25名学生,一共100名学生。
聚类抽样
分层随机抽样在学校里寻找100名不同的学生可能相当耗时。于是我们可以使用集群抽样。在聚类抽样时,需要保证每个集群都能很好地代表总体,这一点很重要。在复旦学校中,这意味着每个cluster聚类集合必须良好代表性总体(四个年级全部学生),我们可以找(home room,类似大学宿舍,不是按年级和专业分,而是随机入住的大学宿舍),在每个home room都会有四个年级的学生。以下是集群示例的步骤:
1
以复旦大学所有学生作为总体,按home room将总体分成聚类集合。在每个聚类集合中,学生都是不同的(多个年级)。
2
随机取3个聚类集合作为样本数据。
参考信息:
https://www.statsmedic.com/post/stratified-random-sample-vs-cluster-sample
----------------------
学而时习之,不亦说乎👍【点赞】鼓励自己更加优秀,您的声音是我们前进的源动力,祝您生活与学习愉快!~
- 评论(0)
- 追问(1)
- 追答
-
ヾ(◍°∇°◍)ノ゙你好同学,
重抽样的前提是样本容量较少的情况下,需要产生较多样本数量,去对总体进行估计。
重抽样resampling有两种方法:
1.Jackknife
2.Bootstrapping
Jackknife的优点及缺点:计算量小,方便,但是重抽样之后的数据之间差异极小
Bootstrapping优点及缺点:重抽样之后的数据之间差异较大,认为可以设定重抽样后的数据个数,但是计算量较大
Jackknife 和Bootstrapl 的区别:
1.Jackknife方法只能产生了n个复制(有n个样本容量,那么重抽样产生的数据就是每次切掉一个,结果有n个新数据集),而Bootstrap 方法可产生B个重抽样复制,且B可以认为任意定B的大小
2.当n較小时,能更容易(更快)计算n个Jackknifef的重抽样数据
3.与Bootstrap 相比,Jackknifel 只利用了更少的信息(更少的样本)。
4.Jackknifef 产生的数据之间的差异很小,每两个Jackknifel 重抽样样本中只有两个单个观测值不同
----------------------
学而时习之,不亦说乎👍【点赞】鼓励自己更加优秀,您的声音是我们前进的源动力,祝您生活与学习愉快!~
评论
0/1000
追答
0/1000
+上传图片



