四格表的确切概率法(R. A. Fisher,1934)又称四格表概率的直接计算法。常用于四格表资料的假设检验。基本思想是: 在四格表的周边合计不变的条件下,直接计算表内四个数据的所有各组合之概率,其和为1。各组合的概率服从超几何分布。按检验假设取单侧或双侧的累计概率,即可按所取检验水准作出推断结论。
由于本法可算出确切的概率,特别适用于以下情况:①用四格表假设检验的其他方法所得概率十分接近所取检验水准; ②当x2值大于xα,12而校正x2值小于xα,12时;③样本含量小,尤其当两样本含量相差悬殊,同时两样本阳性数之和与阴性数之和相差也悬殊; ④样本实际频数a、b、c、d中出现任何小值(如0,1,2,…等),而不宜计算x2值时。
概率的计算方法是将四格表的周边合计固定,表内四个实际频数之组合数共有“周边合计中的最小数+1”个。各组合的概率按式(1)计算。
式中符号意义如下:
式(1)可用带阶乘的电子计算器计算(但常用计算器只能作小于70!的运算,否则就溢出),亦可用对数计算,阶乘的对数有表可查,见有关统计书。
各种组合下累计概率的计算,单、双侧检验不同。
(1) 单侧检验: 若两样本率p1-p2=D,则取p1-p2≥D的各组合的累计概率为单侧P值。反之若两样本率p1-p2=-D,则取p1-p2≤-D的各组合的累计概率为单侧P值。
(2) 双侧检验: 若两样本率|p1-p2|=D,则取|p1-p2|≥D的各组合的累计概率为双侧P值。
当a+b+c=c+d或a+c=b+d时,四格表全部组合的序列呈对称状态,为简化计算,取单侧累计概率之2倍即为双侧累计概率;但当a+b≠c+d且a+c≠b+d时,组合的序列并非对称,不应采用此法,尤其是小样本资料。如例1中单侧累计概率之2倍为0.04119×2=0.08238,明显大于实际的双侧累计概率0.05575。例1 甲乙两种疗法对某病的治疗结果如下:
试分别比较:(1)甲法有效率是否高于乙法?(2)甲乙两疗法的有效率有无差别?
本例四格表周边合计的最小值为10,故四格表的组合数共10+1=11个,计算所有组合的p1、p2和p1-p2,并按式(1)计算P值。如第⑤组合为观察所得样本数据,则
(1) 单侧检验:
H0:甲法有效率等于乙法,
H1:甲法有效率高于乙法。
α=0.05。取p1-p2≥35.0%的各组合之P值和,即第①、②、③、④、⑤组合P值之和:
P=0.00000+0.00004+0.00068+0.00631+0.03416=0.04119,
按α=0.05水准拒绝H0,接受H1,故认为甲法有效率高于乙法。
(2) 双侧检验:
H0:甲法有效率等于乙法,
H1:甲法有效率不等于乙法。
α=0.05。
取|p1-p2|≥35.0%的各组合之P值和,即第①、②、③、④、⑤、(11)组合P值之和:
P=0.04119+0.01456=0.05575。
按α=0.05水准不拒绝H0,故尚不能认为甲乙两法的有效率不同。
查表法 由于本法计算较繁,已制成多种工具表备查,如由后列参考书可直接查出两样本含量均不超过50或两样本阳性数之和及阴性数之和均不超过50的范围内所有组合之单侧检验和双侧检验界值,各包括α=0.05和α=0.01两种水准。
递推法 在四格表各组合的序列中,当按式(1)求得任一组合的概率后,可按式(2)或式(3)的递推公式,求出相邻组合的概率,并递推出所有组合的概率:
式中Pα 为四格表中实际频数α确定时该组合的概率,P(α+1)为相邻组合(α+1)确定时的概率,P(α-1)仿此。为减少计算误差,计算过程中,P应多保留几位小数。例2 在例1的四格表组合序列中,已算出第⑤组合的P=0.0341558,试递推出其余各组合的概率。
按式(2)由第⑤组合递推出第④组合的概率
由此尚可递推出第③、②、①组合的P值;
按式(3)由第⑤组合递推出第⑥组合的概率由此尚可递推出第⑦、⑧、⑨、(10)、(11)组合的P值。
参考书目 陆守曾等: 医用统计工具表,吉林人民出版社,1978
![]() |