TIFFANY2024-01-24 09:58:07
可以解释一下这里的bullet point都在讲什么啊
回答(1)
黄石2024-01-25 10:29:02
同学你好。这些都是从理论和长期的实证研究中得出的结果。
1. 对于正态随机变量,rank correlation基本上等于linear correlation(这个的背后原因是因为Pearson correlation在正态分布的条件下几乎‘穷尽’了变量之间可能的关系,属于超纲内容,不需要掌握)。
2. 随着Pearson correlation的上升,Kendall´s tao也会上升(毕竟都是衡量变量间的关系的),但这个关系是非线性的。
3. 实证表明在线性关系下,Kendall´s tao的计算值的绝对值相较于Pearson correlation在绝大部分情况下都是偏低的、更趋近于0的。
4. 这一点可以联系着上面第三点继续分析。由于线性关系下Kendall´s tao绝对值较Pearson correlation偏低,所以当研究数据时发现Kendall´s tao略低于Pearson correlation是合理的,并不意味着存在非线性关系。重大非线性关系出现在Pearson correlation接近于0,而Kendall´s tao明显偏大的情况。
- 评论(0)
- 追问(2)
- 追问
-
我还是没太懂你说的第四点可以在解释一下吗?其次我想再问问pearson correlation是解释linear relationship嘛,那kendall是解释非linear的吗
- 追答
-
同学你好。关于第四点,这里所有的系数都是用于衡量随机变量之间的关系的。其中,Pearson correlation又称linear correlation,只能衡量线性关系。而Spearman correlation和Kendall's tao能够衡量的关系更广,包括线性与部分非线性关系。详细来说,它们衡量的是单调关系,monotonic relationship(单调递增,单调递减等类型的关系,见下图)。在数据为线性关系的情况下,Kendall's tao的取值一般较Pearson correlation偏低。因此,当我们发现这两个指标呈现如此关系时,一般认为数据中不存在重大非线性关系。如果存在重大非线性关系,那么Pearson correlation无法对其进行衡量,取值接近于0,而Kendall's tao往往能够捕捉到非线性关系,所以取值可能依然较大。因此,当我们发现Pearson correlation接近于0,但Kendall's tao(以及spearman correlation)的绝对值较大时,就可以判定数据中存在重大非线性关系。
评论
0/1000
追答
0/1000
+上传图片


