189****68902022-03-08 17:30:42
可以理解为p值就是给一个数据的制信吗?p value1.65%就是98.35%信心,但当sample statistics落入1.65%的对应区间内是就要拒绝,双尾的话,就是0.825%,这样理解对吗?
回答(2)
Irene2022-03-10 10:13:00
同学你好
首先针对你的题问,统一回复:
P value按照你的图理解就是样本数据检测出来的test statistics对应的面积?
是的。
就是比如5%的显著性水平在表里能得出一个critical value,这个critical value不代表面积吧?
是的。
如果上面说的没错,那也就是说P value和显著性水平是一类东西?
是的,所以p值才能和显著性水平alpha比较,这两个是同类的概念,都是尾部的面积。
概念辨析:
1. P-value是以检验统计量(TS)为边界的尾部概率,所以画在图上就是以T.S.为边界的尾部的面积。这个P值和检验统计量,都和抽出的样本有关。不同的样本会计算出不同的检验统计量,所以会有不同的p-value。
2. alpha是以关键之(critical value)为边界的尾部概率,是人为设定的显著性水平。所以alpha 和关键值,都与抽样无关。
如图
- 评论(1)
- 追问(4)
- 追答
-
第二个部分,你的提问和回答如下:如果这样理解没错的话,p value是一个最小的能拒绝null的显著性水平,没错,那么,视频里的1.95从何而来?
答:
1. 1.95是抽出一组样本计算出的检验统计量。
2. 给定1.95,p值不变(假设=3%),现在变的是人为设定的alpha。
alpha=5%,可以拒绝null;
alpha减少一点=4%,可以拒绝null;
当alpha减少到多少的时候,不能拒绝null了呢?3%是一个临界,当alpha小于3%的时候,不能拒绝null。
所以P值=3%是一个最小的alpha
- 追答
-
第三部分,你的问题如下:如果这样理解没错的话,p value是一个最小的能拒绝null的显著性水平,没错,那么,视频里的1.95从何而来?是样本的检测test statistic结果啊,所以当我再去取其他的额样本进行检测,得出不一样的T。S,那p-value的参考基准又变了咯?所以搞半天这个p-value有什么意义?你能理解我的想法吗?
答:我可以理解你的问题哈,这是很多同学的疑问,主要是因为对于假设检验的机制理解有偏差哈。
第一, 假设检验不是验真,而是证伪。
我们把我们认为正确的东西放在Ha中,而把我们认为假的东西,放在H0中。我们是通过证明H0的假,拒绝原假设;来反推出Ha的真。
在数学中,证伪主要用反证法,反证法最大的好处是:只要举“一个”反例,就可以推翻H0。
所以,我们只需要抽取一组样本,不管这个样本的检验统计量是2还是3,只要检验统计量的绝对值大于关键值;也不管p值是1%还是2%,只要p值小于alpha;此时就说明抽样的结果落在尾部,就说明H0是假的,就能够反推出Ha是真的。
- 追答
-
但是反过来,如果检验统计量或者p值没有落在尾部,无法拒绝H0。
因为在假设检验的过程中,我们只抽了“一组”样本,只举了“一个”例子,所以只能证伪,不能说明H0是真的。
这就是为什么,严格来说,我们只能说“不拒绝”原假设,而不能说“接受”原假设。
- 追答
-
最后,你的提问如下:而且我再重复看视频,大概第8遍有了,我捕捉到一个点,周老师说“。。。数据本身的alpha值比p大/小。。。”,这个用词对吗?我觉得有问题,alpha值本身就是由致信区间决定的,100-致信=alpha,那这个alpha就是人为决定的,怎么说是数据本身的alpha呢?这在概念上就容易让我这种基础不牢的学生混淆。
答:是的,你的理解是正确的。我们之后会对视频内容进行修正,感谢您的宝贵意见~
Evian, CFA2022-03-08 17:53:23
ヾ(◍°∇°◍)ノ゙你好同学,
你的理解不完全正确。不是信心,p-value是一块面积。
关键值CV对应significant level,检验统计量T.S.对应的是某一部分尾部面积p-value。
所以:CV和T.S. ,significant level和p-value,这两组都可以比较来拒绝原假设
这个定义你是掌握的:p-value是一个指标,当p-value小于显著性水平的时候,我们可以拒绝原假设,和T.S.检验统计量大于CV关键值拒绝原假设的道理一致。
The p-value is the smallest level of significance based on the assumption that the null hypothesis will be rejected.
为什么说p-value是最小的可以拒绝原假设的显著性水平呢?这个时候是在比较“面积”,p-value和显著性水平,举个例子:
假设p-value现在是5%,那么拒绝原假设的前提是显著性水平大于等于5%,此时5%是显著性水平的最小取值(这里不要纠结是否等于5%的问题,等号在服从连续分布的随机变量中没有太大讨论意义,比如p-value和显著性水平都是5%怎么办?这种问题我们不讨论)
------------------------
感谢乘风破浪的您来提问~如果您对回复满意可👍【点赞】鼓励您和Evian更加优秀,您的声音是我们前进的动力,祝您生活与学习愉快!~
- 评论(0)
- 追问(8)
- 追问
-
脑子有点乱,首先周老师是用10%significance来举例子的,那么10%不是p value对把?而且这个10%,以及他后面降到的5.1%, 其实都是人为设定的东西,不是populatin或者样本本身测试出来的数据对把?他用的10%,其实目的是引出critical value--1.65,然后他说样本测出一个值为1.95,这个1.95我的理解是其实它才是真实存在的东西,对吧?然后说1.95 是大于1.65 的,所以reject。
到目前我的理解没错的话,接下来就是搞不清概念的时候:
什么叫“p值越小越容易拒绝”???不是应该还有条件的吗?
p越小(并且真实测试得出的test、sample statistics值也同时大于这个p值时),越容易拒绝null,对吗?还有,我老是过一会就搞混,p值到底是一个critical value,就是超出平均数多少倍标准差的那个数,还是值一个significance,也就是100%-xx%得出的数字?如果是后者,那岂不是p越小,等于正态分布的中间区间越宽吗?那既然中间越宽,一个样本不是更不容易落位在这个区间之外?那不就是更不容易拒绝吗?好乱啊这称谓换来换去好没意思啊玩文字游戏。
- 追答
-
请参考附图,以单尾的假设检验为例子
- 追答
-
1 10%不是p-value
2 alpha和查表值,和样本数据无关
3 显著性水平可以用来查表得出Critical value
4 p-value越小,T.S.越大,两者如附图所示,是对应关系,T.S.距离均值越远,可以拒绝原假设
- 追问
-
P value按照你的图理解就是样本数据检测出来的test statistics对应的面积?
就是比如5%的显著性水平在表里能得出一个critical value,这个critical value不代表面积吧?
如果上面说的没错,那也就是说P value和显著性水平是一类东西?
- 追问
-
如果这样理解没错的话,p value是一个最小的能拒绝null的显著性水平,没错,那么,视频里的1.95从何而来?是样本的检测test statistic结果啊,所以当我再去取其他的额样本进行检测,得出不一样的T。S,那p-value的参考基准又变了咯?所以搞半天这个p-value有什么意义?你能理解我的想法吗?
- 追问
-
就是现在说p5.1%是最小的拒绝null的significance,但现在重新测了一组数据,的出来1.90了TS,那p变成了4.8%4.7%了,那没个准了哇。
- 追问
-
而且我再重复看视频,大概第8遍有了,我捕捉到一个点,周老师说“。。。数据本身的alpha值比p大/小。。。”,这个用词对吗?我觉得有问题,alpha值本身就是由致信区间决定的,100-致信=alpha,
那这个alpha就是人为决定的,怎么说是数据本身的alpha呢?这在概念上就容易让我这种基础不牢的学生混淆。
- 追答
-
感谢你对Irene的肯定!
回到你回复的第三部分,你的意思是说同意我吗?
【回复】同意。
就是这个判断p值的基准,1.95,其实是一次抽样的出的东西,它并不是真正能代表population的“标准答案”,所以自然的,得出临界值p为3%自然也不是一个固定的,属于population本身的一种“属性”对吧?
【回复】同意,1.95是周老师给出的test statistics检验统计量,是通过一次抽样的样本数据计算出来的数值,代表样本而不是总体,同样的这次抽样有p-value=3%,也是样本计算出来的数据,不是总体属性(特征)
最后在说到你说的“只是一次,没有关系”,也就是说,这个1.95也好,3%也好,如果导致没能成功拒绝null,你也就只是把它看成一次,怎么说呢,没成功的实验,是这样吗?
【回复】同意,此次抽样计算出来的数据,没有成功拒绝原假设。


评论
0/1000
追答
0/1000
+上传图片