Shihairong2019-11-04 17:27:46
图中ANOVA table中最后一张表格,截距与斜率其实是通过了几次抽样回归,用OLS计算出的截距与斜率的均值,于是有了各自的标准误。而至于总体相关系数rou的显著性检验,是不是独立于截距斜率抽样回归单独进行的?先从总体中抽取大样本,计算出样本相关系数r,进行t检验,得出拒绝总体相关系数rou为0结论后,再次进行多次抽样得到截距与斜率的均值?总体相关性检验和计算截距斜率均值的样本可以是取自总体完全不同的样本?谢谢
回答(1)
最佳
Peter F2019-11-04 18:21:13
同学,你好:总体相关系数 Rho 的显著性检验,不是独立于截距斜率抽样回归单独进行的,思考的逻辑是这样,回归是线性的,先通过 Rho 判断X与Y之间是否存在线性,如果拒绝 Rho =0 的原假设,那么X与Y之间存在线性,具体这个线性关系是怎样的,那么就是通过回归方程来具体计算出来(b_0、b_1等等)。当然,如果X与Y之间都不存在线性,那么回归方程也就不成立了。
- 评论(0)
- 追问(17)
- 追问
-
好的,但进行rho显著性检验和计算b0和b1时,举例说明,先抽取二千个样本进行rho显著性检验,拒绝原假设后,将这二千个样本分成十组,每组二百个,分别进行截距与斜率测试,得到十个截距与斜率,计算出截距均值与斜率均值和各自标准误,而截距均值和斜率均值代入了最终回归方程作为参数。这是这么一个过程么?另外单独对于截距均值与斜率均值进行的设定值为0的原假设进行t检验(本题中分别为11.328和7.988),我认为没有太大的意义,已经计算出均值了,已经形成了回归方程了。这里的截距与斜率均值SEE,是不是在出现条件异方差和时间序列时进行修正,来捉高回归方程的R2?但是SEE本身不是回归方程的参数,修正SEE而不改变方程参数如何达到修正效果?这个是我的疑惑。谢谢。
- 追答
-
同学,你好:
1)不是这个过程:先抽取二千个样本进行rho显著性检验,拒绝原假设后,将这二千个样本直接回归,得到截距和斜率;
2)后面两个问题的统一的回答是:只是参考,不是一元一次方程的角度理解,用回归模型去计算一个精准的结果,现实中,回归分析用于归因分析、写论文比较多。
建议做完课后题,再仔细看一下原本书,会有更深入的理解。
- 追问
-
好的,回归不是为了计算精确结果而是归因分析,谢谢指出这个关键点。本例中回归方程是通过二千个样本一次性通过OLS得出截距与斜率,而至于截距与斜率的SEE与本次二千个样本抽样无关,因为只进行了一次抽样,不存在多次抽样求均值求SEE的问题,这里的SEE是不是另有benchmark?因为不存在均值的均值的概念了。因为是归因分析,可以由某些现象来设定特定的值来作为总体均值来计算SEE来进行归因,而至于出现了序列相关,异方差等现象,可以调整那个特定的值来调整SEE,来分析Y与特定自变量之间的相关性与相关程度。望指正。
- 追答
-
同学,你好:‘这里的SEE是不是另有benchmark?’不是 benchmark 的理解角度,是用来计算 t 检验统计量的,用计算得到的 t 检验统计量的值来判断原假设是否成立。其他在 CFA 体系下,没有太大的问题。
- 追问
-
也是就是说SEE可以人为设定倒推出来,在这个设定的SEE水平下(尽管可能与将二千个样本分十次抽样所对应的SEE不符),t检验量在设定的置信区间可以拒绝原假设,那么有了这个SEE,就可以从原本回归方程的点估计实现区间估计,归因与预测更加严谨。统计学无法消除波动性,所以可以用离散度描述进行区间估计,尽量涵盖波动区间。可以这样理解么?谢谢。
- 追问
-
1)SEE可以通过多次抽样检验获得,这种SEE在已经做完的抽样试验前提条件下不可变 2)也可以在一定置信区间上设定不同关键值,检倒推出一个SEE. 这种情况下SEE是假定值,可以随着不同的设定关健值而变化。
- 追问
-
老师,我纠结一下,以上两个提问中SEE为笔误,实际上指的是截距与斜率的标准误SE。谢谢
- 追问
-
老师,我纠正一下,以上两个提问中SEE为笔误,实际上指的是截距与斜率的标准误SE。谢谢
- 追答
-
同学,你好:关于上述的 2)也可以在一定置信区间上设定不同关键值,检倒推出一个标准误. 这种情况下标准误是假定值,可以随着不同的设定关健值而变化。有一些不是很能理解你的意思,能否就‘标准误是假定值’中的假定,你是怎么理解的?‘设定关健值’,所谓的关键值,你是指什么关键值?不是很理解你的意思,请再说明一下。其他内容的理解,大致正确的。
- 追问
-
我的理解是因为只有一次抽样,从而无法通过多次抽样计算得出截距和斜率的SE, 我的疑问是如果要在一定置信区间上得到t检验值进行假设检验,那这个截距和斜率的SE如何得到或者估算?
- 追答
-
同学,你好:这个概念在 CFA 原版书不做要求,其实是超出考纲范围的,建议以原版书要求为主。解答请参考以下截图。
- 追问
-
谢谢老师,我只要知道这里的斜率与截距的SE是有特定的估算方法,而且这个SE是可以进行调整就可以了,而且这也解释了我对于课件中老师提到序列自相关与条件异方差时可以对SE进行调整的困惑,因为现在我知道了SE不是只是通过多次抽样取均值再求均值的标准差这种单一方法的,就如我之前向老师请教过,统计学里有多种等价估算或者无偏估计,考察的是变量的范围与概率,估算与估计有很多其他的定理与公式,而不是机械的抽样,当变量与变量之间存在某种线性或者非线性关系时,检验方法也会多种多样(当然这些与CFA考试无关了,是更高阶数理统计的范围了)。这个理解还有要纠正的地方么?
- 追答
-
同学,你好:你的理解是没有问题的,随着你未来学习的知识面越广,你的理解也会更加深入,这边也推荐给你两本基础的参考书,《概率论与数理统计》陈希孺 著,《统计学的世界》 郑磊译,今后有时间可以看一下。
- 追问
-
好的,谢谢,理论数学家们太厉害了,数学学的好的,逻辑思维能力特别强,能变通抓住重点。
- 追问
-
至于条件异方差与序列自相关对于截距和斜率SE的调整,可以理解为统计学领域用更加渐近的方法来估算SE,得出更加可靠的假设检验结果,作个类比,比如契比雪夫不等式可以用来估计,但是对于检验结果存疑时,可以用正态分布来更加可靠地估计。正因为是对变量的估计与估算(比如这里的SE),于是便存在不同精度的估算方法。其实觉得统计检验量本身可能存在不少未知领域,比如老师提到的Durbin Watson test,就存在序列自相关无法判定的领域。总而言之,对于统计检验量公式中所涉及的要素,可通过不同方法进行不同精度的调整从而进行相应的归因分析。这个是不是回归分析的大概逻辑?谢谢
- 追答
-
同学,你好:大致上,就是这个思路的。
- 追问
-
好的,明白了,谢谢。


评论
0/1000
追答
0/1000
+上传图片