对计数资料作相关分析的目的是推断两因素间有无相关关系,常用x2检验;必要时再进一步确定相关的密切程度,常用列联系数来说明。分析时常按配对设计,将单一样本的每一观察单位同时按两种因素 (如两种检验方法、两种治疗方法或两种特征等)的不同水平(如类别、等级、程度等)分组。如甲因素有R个水平,乙因素有C个水平,分组后即得R×C列联表。如表1为R与C均等于2的2×2表,有a、b、c、d四个基本数据,特称为四格表。表3为3×3表。
四格表资料的相关分析 推断两因素间有无相关关系一般用x2检验,可按式(1)计算统计量x2值。
式中a、b、c、d为实际频数或对子数,n为样本含量或总对子数。条目“两样本率比较”中,计算x2值的其他公式亦可选用。算得x2值后,查x2界值表得P值,按所取检验水准作出推断结论。
当样本含量甚小时宜用四格表的确切概率法直接计算P值(见条目“四格表的确切概率法”)。
经假设检验推断两因素间有相关关系,若须进一步说明相关的密切程度,可按式(2)或式(3)计算相关系数(亦称列联系数) r或rn。类似普通相关系数,其值在-1与+1之间。绝对值愈大,相关程度愈高;等于1为完全正相关,等于-1为完全负相关,等于0为无相关。
式中a、b、c、d的意义同式(1)。
K. H. Ives和J. D. Gibbon提出用
式中符号意义同式(1),(a+d)为反应相同的对子数,(b+c)为反应不同的对子数。由式(3)可见: 如例1,若所有对子两法结果全相同,即b、c均为零,则rn=1,为完全正相关;若所有对子两法结果全不同,即a、d均为零,则rn=-1,为完全负相关;若结果相同与结果不同的对子数各占1/2,即α+d=b+c,则rn=0,为无相关。
例1 就表1资料说明两种方法检查食品沙门菌的结果是否一致。
表1用两法检查同一批鸭样的结果
荧光抗体法 | 常规培养法 | 合 计 | + | - | |
+ | 160(a) | 26(b) | 186 | ||
合 计 | 165 | 74 | 239 |
(1) 推断相关关系:
H0:两法无相关,
H1:两法有相关。
α=0.05。
按式(1)
查x2界值表得P<0.005,按α=0.05水准拒绝H0,接受H1。说明两法检查结果有相关,用荧光抗体法检查为阳性的其常规培养法的阳性率亦高。
(2)确定相关的密切程度:按式(2)
或按式(3)
例2 就表2资料说明拍胸部X线片和痰结核菌培养两种检查方法之间的相关关系。
表2 16例肺结核患者分别用两种方法检查的结果
X 线 片 | 痰 培 养 | 合 计 | + | - | |
+ | 7(a) | 2(b) | 9 | ||
合 计 | 8 | 8 | 16 |
(1)推断相关关系:本例样本含量较少,宜用四格表的确切概率法。
H0:两法无相关,H1:两法有相关。
α=0.05。
按α=0.05水准拒绝H0,接受H1。说明肺结核患者胸部X线片和痰结核菌培养两种检查的结果有相关。
(2)确定相关的密切程度:按式(2)
或按式(3)
R×C表资料的相关分析 推断两因素间有无相关关系常用x2检验,可按式(4)计算统计量x2值。
式中A为R×C表中每格的实际频数或对子数,nR与nC分别为实际频数所在行R、列C的合计,n为样本含量或总对子数,R为行数,C为列数。条目“样本构成比的比较”中,计算x2的其他公式亦可选用。算得x2值后,查x2界值表得P值,按所取检验水准作出推断结论。
经x2检验推断两因素间有相关关系,若须进一步说明相关的密切程度,可在计算x2值的基础上,按式(5)或式(6)计算列联系数。其值在0~1之间,0表示完全独立,1表示完全相关,愈近于0,说明几乎没有关系,愈近于1,说明关系愈密切。列联系数有多种,常用的如下:
(1) Pearson列联系数(P)
(2) Cramér (修正)列联系数(C)
式中x2为R×C表的x2值,n为样本含量,min(R-1,C-1)表示取(行数-1)或(列数-1)中的较小值。
例3 以眼为单位观察20岁以上居民眼睛的晶状体点状混浊程度与年龄间的关系,得资料见表3,试分析两者之间的相关关系。
表3 某地居民眼晶状体混浊度与年龄的关系
年龄(岁) | 晶状体混浊程度 | 合 计 | + | ++ | +++ | ||
20~ | 215 | 67 | 44 | 326 | |||
合 计 | 494 | 296 | 239 | 1029 |
(1)推断相关关系:
H0:晶状体的混浊度与年龄无关(即相互独立),
H1:晶状体的混浊度与年龄有关。
α=0.05。
按式(4)
查x2界值表得P<0.005,按a=0.05水准拒绝H0,接受H1。说明晶状体混浊度与年龄之间存在相关。
(2) 确定相关的密切程度:按式(5)
![]() |