上QQ阅读APP看书,第一时间看更新
2.4.1 Pearson相关系数
Pearson相关系数是研究数值变量之间线性相关性的。若两个数值变量之间是非线性关系,则要求两变量数据的间距相同或来自同一个正态分布中,所以并不是所有的数值型变量都可以用Pearson相关系数来表示两个变量之间的相关关系。
一般来说,变量之间的线性相关性分为三种:正相关、负相关、不相关。正相关是指若一个变量往一个方向变化,则与之相关的变量也会沿着同一个方向变化。负相关是指若一个变量往一个方向变化,则与之相关的变量会沿着相反的方向变化。不相关是指无论其中一个变量如何变化,均与另一个变量无关。
相关性强弱一般用符号r来表示,正负号表示变量之间相关性的正负关系,其中:
·0≤|r|<0.3表示弱相关;
·0.3≤|r|<0.5表示中等相关;
·0.5≤|r|≤1.0表示强相关。