等级资料的直线相关分析称等级相关,这是一种非参数统计方法。分析两事物数量间的直线关系时,对下列情况宜用等级相关: ①两事物的量,有的不能准确测量,只能按大小、程度、优劣或综合判断给出顺序号; ②虽可测量,但总体数据的分布未知或已知不是正态双变量,不能作积差相关分析; ③只需对两事物数量之间的关系作初步分析等。
等级相关的常用分析方法有Spearman法和Kendall法,两法有很多共同点: ①都是用一个等级相关系数(分别用符号rS及rK表示)来说明两变量间直线关系的方向和密切程度。rS或rK的值都在+1与-1之间,数值为正表示正相关,数值为负表示负相关。②样本rS及rK分别是总体等级相关系数ρS及ρK的估计值,要推断总体中两变量X、Y间有无直线关系须经假设检验。两法的不同点只是rS及rK的计算方法不同,作假设检验时的统计用表不同。
表1 等级相关系数rs界值表
n | P(1): 0.05 | 0.025 | 0.01 | 0.005 |
4 | 1.000 |
|
|
|
5 | 0.900 | 1.000 | 1.000 |
|
6 | 0.829 | 0.886 | 0.943 | 1.000 |
11 | 0.536 | 0.618 | 0.709 | 0.755 |
16 | 0.429 | 0.503 | 0.582 | 0.635 |
25 | 0.337 | 0.398 | 0.466 | 0.511 |
50 | 0.235 | 0.279 | 0.329 | 0.363 |
100 | 0.165 | 0.197 | 0.233 | 0.257 |
摘自 Zar JH: Biostatistical Analysis,p498 Pren-tice-Hall,Inc.,1974
表2 等级相关系数rK界值表
n | P | n | P | 0.05 | 0.01 | 0.05 | 0.01 | ||
4 | 1.000 | 1.000 | 21 | .267 | .371 | ||||
6 | .733 | .867 | 26 | .237 | .329 | ||||
11 | .418 | .564 | 31 | .213 | .295 | ||||
16 | .317 | .433 | 36 | .194 | .273 |
摘自 Daniel WW: Applied Nonparametric Statis-tics,p467,Houghto Mifflin Company,1978
Spearman法 等级相关系数rS的计算步骤如下:(1)将成对的资料列出如表3第(2)、(4)栏。如果原资料不是秩次,则X、Y分别按数量从小到大编秩,如表3第(3)、(5)栏。例如公社4黄曲霉素相对含量为0.7,是10个公社中最低的,定秩次为1;稍高的是公社2,相对含量为1.0,定秩次为2;余类推。若几个观察值相等,应将它们的秩次相加求平均秩次,作为每个观察值的秩次。如果公社4、2的相对含量皆为0.7,那么它们的秩次均应定为1.5[=(1+2)/2]。
(2)计算每对观察值秩次的差值d及d2、∑d2,如表3第(6)、(7)栏。
(3) 按式(1)计算rS。
式中n为样本含量。
对rS进行ρs=0的假设检验,只需将算得的rS按n查表1(rS界值表)得P值,按所取检验水准作出推断结论。
例1 肝癌病因研究中,调查某地10个公社的肝癌死亡率(1/10万)Y,与某种食物中黄曲霉毒素相对含量(以最高含量为10)X,结果见表3第(2)、(4)栏。试用Spearman等级相关系数推断X、Y间有无直线相关。
H0: ρs =0,
H1: ρs≠0,a=0.05。
编秩及初步计算结果见表3第(3)、(5)、(6)、(7)栏。
按n=10查表1得P=0.02,按a=0.05水准拒绝H0,接受H1。可以认为食物中黄曲霉毒素含量与肝癌死亡率间有正相
表3 rS计算表
公社 | 黄曲霉毒素相对含量 | 肝癌死亡率(1/10万) | d | d2 | X | 秩次 | Y | 秩次 | ||
1 | 3.7 | 4 | 46.5 | 7 | -3 | 9 | ||||
42 |
关。黄曲霉毒素含量高,肝癌死亡率也高。
rS的校正: 编秩时,观察值相同则取平均秩次,但相同秩次较多时,影响Σd2值,这时可用式(2)计算校正等级相关系数r′S。
次的个数。k为有相同秩次的组数.当TX=TY=0时,式(2)等于式(1)。
假定例1中前5个公社的X相同,各取平均秩次为3;第6、7、8公社的X相同,各取平均秩次为7;第9、10公社的X也相同,各取平均秩次为9.5。这样k=3,t1=5,表示5个秩次相同,同理t2=3,t3=2。故TX=(53-5)/12+(33-3)/12+(23-2)/12=12.5。肝癌死亡率没有相同秩次,故TY=0。并算得Σd2=33.5。计算校正的等级相关系数为
若不校正,将Σd2=33.5代入式(1),得rS=0.797。Kendall法 等级相关系数rK的计算步骤如下:
(1) 列资料,编秩次,同Spearman法,并要求将其中X或Y的秩次按自然数排列,如表4第(2)、(3)栏。
(2) 计算累计秩次个数S。若X的秩次按自然数排列,则计算Y的每个秩次下面大于该秩次的秩次个数,然后合计即S。如表4第(4)栏。Y的第1个秩次为3,3的下面9个秩次中比3大的有7个,故秩次个数为7; Y的第4个秩次为7,其下大于7的秩次个数为3,余类推。这些Y的累计秩次个数合计为34即S。
当遇到原始数据相同时,仍取平均秩次,按下例求累计秩次个数。
秩 次 | Y的累计 | X | Y |
Y的第一个秩次是1,其下有5个比它大,故秩次个数为5; Y的第二个秩次为2.5,下面有3个比它大,故秩次个数为3;Y的第四个秩次为4,与它对应的X秩次是4.5,它下面的一个秩次也是4.5,所以第4个秩次个数记为1而不是2。这样处理的依据是,当分析X与Y的相关时,X变Y不变或X不变Y变,均属无相关。
(3) 按式(3)计算rK值。
式中n为样本含量。
对rK进行ρK=0的假设检验,只需将算得的rK按n查表2(rK界值表)得P值,再按所取检验水准作出推断结论。
rk的校正: 当相同秩次较多时,可用下式计算校正等级相关系数r'K
例2 试对例1资料用Kendall等级相关系数作分析。
表4 rK计算表
公社编号 | 秩 次 | Y的累计 | 黄曲霉毒素相 | 肝癌死亡率 | |
4 | 1 | 3 | 7 | ||
34 |
H0: ρK=0,
H1: ρK≠0。
α=0.05。
将X的秩次按自然数排列并计算Y的累计秩次个数见表4第(4)栏。
按n=10查表2,得0.05>P>0.01,按α=0.05水准拒绝H0,结论同例1。
![]() |