直线相关与回归是研究两变量间直线关系的两种统计方法。直线相关用相关系数r说明直线关系的方向和密切程度; 而直线回归用直线回归方程描述两变量变化的数量关系,其中回归系数b,说明X每变动一个单位,Y平均变动的单位数。直线相关与回归虽有区别,但又互相联系。区别
(1)在资料要求上,相关要求两变量X、Y都是随机变量,如正常人的血清胆固醇和动脉壁胆固醇含量,两者都不能预先指定;回归要求Y是随机变量,而X可以是随机变量,亦可以是一般变量,即可以指定,如毒理实验中,选定某毒物的几个浓度,测定各浓度对数与死亡率的概率单位的关系。
(2)在意义上,相关反映相互关系; 回归反映依存关系。
(3) 在应用上,说明变量间的相关程度用相关;说明两现象间变化的数量关系用回归。
联系
(1) 同一资料的r、b正负号相同。如r为正,说明X增大(或减小),Y亦增大(或减小); b为正,说明X增加(或减少)一个单位,Y平均增加(或减少)b个单位。
(2) r的假设检验(检验假设H0为总体相关系数ρ=0)与b的假设检验(检验假设为总体回归系数β=0) 均用t检验,统计量t值的计算公式不同,但同一资料的数值相等,即tr=tb,故结论相同,因而可用r的假设检验(直接查表)代替b的假设检验,较为简便。
(3) r与b可以相互转换。
式中lXX、lYY分别为变量X、Y的离均差平方和,lXY为变量X、Y的离均差积和,bY.X为由X推Y的回归方程之回归系数,bX.Y为由Y推X的回归方程之回归系
秩 次 | Y的累计 | |
X | Y | 秩次个数 |
Y的第一个秩次是1,其下有5个比它大,故秩次个数为5; Y的第二个秩次为2.5,下面有3个比它大,故秩次个数为3;Y的第四个秩次为4,与它对应的X秩次是4.5,它下面的一个秩次也是4.5,所以第4个秩次个数记为1而不是2。这样处理的依据是,当分析X与Y的相关时,X变Y不变或X不变Y变,均属无相关。
(3) 按式(3)计算rK值。
式中n为样本含量。
对rk进行ρX= 0的假设检验,只需将算得的rX按n查表2(rK界值表)得P值,再按所取检验水准作出推断结论。
rK的校正: 当相同秩次较多时,可用下式计算校正等级相关系数r′K
例2 试对例1资料用Kendall等级相关系数作分析。
表4 rK计算表
公社编号 | 秩 次 | Y的累计 | 黄曲霉毒素相 | 肝癌死亡率 | |
4 | 1 | 3 | 7 | ||
34 |
H0: ρX=0,
H1: ρK≠0。
a=0.05。
将X的秩次按自然数排列并计算Y的累计秩次个数见表4第(4)栏。
按n=10查表2,得0.05>P>0.01,按a=0.05水准拒绝H0,结论同例1。
![]() |