本法利用两样本观察值的秩来推断两样本分别代表的总体的位置有无差别 (即两总体的变量值有无倾向性的不同)。检验假设H0是两总体分布相同,备择假设H1是两总体的位置不同。常用Wilcoxon秩和检验及Ma-nn-Whitney秩检验。适用于计量资料或等级资料,但如资料符合t检验的条件,则本法的效率不及t检验高。Wilcoxon秩和检验(F. Wilcoxon,1945) 方法步骤如下:
(1) 编秩。以n1和n2分别代表两样本含量,并规定n1≤n2。将两样本的全部观察值统一由小到大排列,标以秩次; 凡属不同样本的相等观察值一律取原秩次的平均秩次。
(2) 求秩和T。以样本含量为n1组的秩和为统计量T。若n1=n2,可取任一组之秩和为T。
(3) 以n1、n2-n1及T查表1得P值,按所取检验水准作出推断结论。查表时,若统计量T值在某一行的上、下界值范围内,其P值大于表中相应的P;若T值在上、下界值范围外,其P值小于表中相应的P;若T值恰等于上、下界值,其P值小于表中相应的P值。
表1 秩和检验用T界值表
| P(1) | P(2) |
每组 1行 | 0.05 | 0.10 |
n1 | n2-n1 | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | ||||||||||
2 |
|
|
| 3~13 | 3~15 | 3~17 | 4~18 | 4~20 | 4~22 | 4~24 | 5~25 | |||||||||||
3 | 6~15 | 6~18 | 7~20 | 8~22 | 8~25 | 9~27 | 10~29 | 10~32 | 11~34 | 11~37 | 12~39 | |||||||||||
4 | 11~25 | 12~28 | 13~31 | 14~34 | 15~37 | 16~40 | 17~43 | 18~46 | 19~49 | 20~52 | 21~55 |
(续表)
n1 | n2-n1 | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | ||||||||||
5 | 19~36 | 20~40 | 21~44 | 23~47 | 24~51 | 26~54 | 27~58 | 28~62 | 30~65 | 31~69 | 33~72 | |||||||||||
6 | 28~50 | 29~55 | 31~59 | 33~63 | 35~67 | 37~71 | 38~76 | 40~80 | 42~84 | 44~88 | 46~92 | |||||||||||
7 | 39~66 | 41~71 | 43~76 | 45~81 | 47~86 | 49~91 | 52~95 | 54~100 | 56~105 | 58~110 | 61~114 | |||||||||||
8 | 51~85 | 54~90 | 56~96 | 59~101 | 62~106 | 64~112 | 67~117 | 69~123 | 72~128 | 75~133 | 77~139 | |||||||||||
9 | 66~105 | 69~111 | 72~117 | 75~123 | 78~129 | 81~135 | 84~141 | 87~147 | 90~153 | 93~159 | 96~165 | |||||||||||
10 | 82~128 | 86~134 | 89~141 | 92~148 | 96~154 | 99~161 | 103~167 | 106~174 | 110~180 | 113~187 | 117~193 |
摘自山内二郎:統計数值表,269,JSA-1972
本法的基本思想是假设含量分别为n1与n2的两样本,各来自分布相同的两个总体,则n1样本的T与其平均秩和n1(N+1)/2应相差不大(N=n1+n2),若相差悬殊,超出了所取检验水准的界值范围(如表1),表示抽得现有样本统计量T值的概率P很小,因而拒绝假设; 相反,若P不小,则不能拒绝假设。
设含量为n1和n2两样本的秩和分别为T1和T2,则式(1)可用于检查计算有无错误,
n1或n2-n1超出表1范围时可用式(2)计算u值,以正态近似法作出推断。
当相同秩次较多时,比如在观察值较多,尤其在等级资料中,常采用频数表作秩和检验,以各组段的平均秩次代表该组段的所有观察值,如表3。则式(2)的分母须代以式(3)作校正,
式中ti为第i个相同秩次的个数。
例1 测得铅作业与非铅作业工人的血铅值(μg/100g)如表2第(1)、(3)栏,已从小到大排列,试检验两组血铅值有无差别。H0:铅作业工人血铅值的总体分布与非铅作业工人的相同,
H1:铅作业工人血铅值高于非铅作业工人。
表2 两组工人血铅值的秩和检验
非铅作业组 | 秩 次 | 铅作业组 | 秩 次 |
5 | 1 | 17 | 9 |
n2=10 | T2=59.5 | n1=7 | T1=93.5 |
单侧α=0.05。
编秩。将全部17个观察值从小到大标出其秩次,见表2第(2)、(4)栏;两组中各有一个18,因分属两组,均取原秩次10及11的均数10.5。
求秩和。以样本含量较少组的秩和为T=93.5。用式(1)检查计算结果:93.5+59.5=153,表明计算无误。
查表1。单侧检验,当n1=7,n2=10,n2-n1=10-7=3时,93.5在37~89之外,得P<0.005,按α=0.05水准拒绝H0,接受H1,故可以认为铅作业工人的血铅值高于非铅作业工人。例2 用某药治疗不同病情的老年慢性支气管炎病人,疗效见表3第(1)、(2)栏。试比较两种病情的疗效。
表3 某药对两种病情支气管炎的疗效之秩和检验
疗 效 | 单纯性 | 单纯性合并 | 合 计 | 秩次范围 | 平均秩次 | 秩 和 | 单纯性 | 合并肺气肿 | |
控 制 | 65 | 42 | 107 | 1~107 | 54 | 3510 | 2268 | ||
合 计 | 126 | 82 | 208 | —— | —— | 12955.5 | 8780.5 |
H0:两种病情病人的疗效总体分布相同,H1:两种病情病人的疗效不同。
a=0.05。
编秩。此例疗效依次分为四个等级,各等级的病人总数见表3第(3)栏。疗效为“控制”者共有65 + 42 =107人,应占秩次1~107,这107人属同一等级,不能分列高低,故一律以其平均秩次(1+107)/2=54代表;余类推,全部秩次范围及平均秩次分列于第(4)、(5)栏。
求秩和。分别将第(5)栏乘第(1)、(2)栏人数,相加即得两组各自的秩和,见第(6)、(7)栏。如用式(1)检查:8780.5+12955.5=21736,(208)(208+1)/2=21736,说明计算无误。
此例n1=82,n2=126,n2-n1=44,已超出表1所列范围,可由式(2)求u值。又由于此资料的相同秩次很多,须按式(3)作校正。计算过程如表4。
表4 表3资料相同秩次的校正计算
等级 | 相同秩次个数 | t3i | t3i-ti |
控 制 | 107 | 1225043 | 1224936 |
合 计 | 208 |
| 1401360 |
查u界值表得P>0.5,按a=0.05水准不拒绝H0,故认为本疗法对上述两种病情的患者并未显示出不同疗效。
Mann-Whitney秩检验(H. B. Mann,D. R. Whi-tney,1947) 先编秩次,同Wilcoxon秩和检验;再以含量为n1的样本中每一秩次为准,数出含量为n2的样本中秩次大于此每一秩次的个数,如遇秩次相同时,按1/2计,其合计为统计量U(非标准正态变量u),查U界值表(见参考书目),或用式(5)将U变换为T值后查表1得P值。
若再以含量为n2的样本为准,同法可得U2。将前一个U记为U1,则U1+U2 =n1n2,可用于检查计算的正误。
当U界值表查不到(n1>20,n2>40)时,可用式(4)计算u值,以正态近似法作出推断。
当相同秩次较多时,式(4)的分母仍以式(3)作校正。式(4)的分母(标准差)与式(2)的分母相同。
例3 用Mann-Whitney法检验例1资料。
H0、H1与a同例1。
在表2上,先以含量为n1的样本之秩次为准,数出n2样本的秩次中
≥9的有2个(10.5,13),
≥10.5的有1.5个(10.5,13), ≥12的有1个(13),≥14及以上的有0个,故U1 =2+1.5+1+0=4.5。
再以含量为n2的样本之秩次为准,数出n1样本的秩次中≥秩次1,2,…,8的都有7个(9,10.5,12,14,15,16,17),≥秩次10.5的有5.5个(10.5,12,14,15,16,17),≥秩次13的有4个(14,15,16,17),故U2=7×8+5.5+4=65.5。
核算得 4.5+65.5=70,7×10=70。说明计算无误。
查U界值表(从略),得P值,结论同例1。
Wilcoxon秩和检验与Mann-Whithey秩检验是等价的。即对同一资料,用任一检验所得的P值相等,结论相同。它们的关系如下:
如例1,T=93.5,代入式(5)得
与例3中计算得的U1相同。同理,由例3中求得的U=4.5,可按式(5)计算得T=93.5 (同例1),如此可查表1(不必查U界值表)得P值并作结论。
参考书目 山内二郎:统计数值表,274,JSA-1972
![]() |