比较两个或多个样本中位数的目的是推断它们所估计的总体中位数有无差别。常用中位数检验,检验假设H0是各总体的分布相同,备择假设H1是各总体中位数不等或不全相等。本条目只论及双侧检验,单侧检验从略。中位数检验的方法步骤如下:
(1) 将各样本观察值混合后由小到大排列。
(2) 求出混合数据的中位数M。
(3) 分别数出各样本中大于M及不大于M的观察值的个数,列成如表3的列联表形式。对观察值等于M的频数的处理法有三:①将其归入不大于M一类,或大于M一类。②当样本含量n较大,而等于M的频数较少时,将其舍去。③其他归类法。应使拒绝检验假设的可能性最小为宜。
(4) 如各样本含量够大,符合应用x2检验条件时,可用x2检验;对两样本含量均较小的四格表,可用四格表的确切概率法作检验。x2检验中,统计量x2值的计算按式(1)。
式中A为各实际频数,nR与nC分别为A所在行与列的合计数,n为总频数。若大于M与不大于M两类的合计数相等,则式(1)可简化成
式中Ai与ni为第i组的实际频数与样本含量。
例1 某市两个区花鲢鱼含汞量的测定值见表1。问两个区花鲢鱼含汞量的中位数是否不同?
表1 两区花鲢鱼含汞量及合并数列的中位数的计算
含汞量 | 频 数 | 轻污染区 | 对照区 | 合 计 | 累 计 | |||
0.010 |
| 1 | 1 | 1 | ||||
0.045 | 5 | 0 | 5 | 25 | ||||
合 计 | 28 | 23 | 51 |
|
H0:两个区花鲢鱼含汞量的总体分布相同,
H1:两总体中位数不等。
α=0.05。
求混合数据的中位数:两区共28+23=51例,中位数的秩次是(51+1)/2=26,故合并数列的第26个变量值0.050mg/kg就是中位数M,见表1 “*”。轻污染区内大于M及不大于M的频数分别为18及10,对照区的频数计算仿此,得如下四格表。将表内的数据代入式(1):
查x2界值表得P<0.01,按α=0.05水准拒绝H0,接受H1,故可认为两个区花鲢鱼含汞量的中位数不同: 轻污染区高于对照区。
例2 测得三组小儿的白细胞数,见表2,试比较三组中位数有无差别。
表2 三组小儿的白细胞数(1000/mm3)
正常组(10例) | 细菌感染组(14例) | 病毒感染组(11例) | |||
测定值 | 秩次 | 测定值 | 秩次 | 测定值 | 秩次 |
4.70 | 3.5 | 5.70 | 9 | 2.85 | 1 |
H0:三个总体的分布相同,
H1:三个总体中位数不等或不全相等。
α=0.05。
三组共10+14+11=35例,中位数的秩次是(35+1)/2=18。故混合秩次为18的那个数据9.00×103/mm3就是中位数M,见表2 “*”。组成2×3列联表,见表3。将数据代入式(1):
表3 表2资料的三组中位数比较
| 正常组 | 细菌感染组 | 病毒感染组 | 合 计 |
大于M | 2 | 13 | 2 | 17 |
合 计 | 10 | 14 | 11 | 35 |
查x2界值表得P<0.01,按a=0.05水准拒绝H0,接受H1,故可以认为三组小儿的白细胞中位数不等。从本例具体数据可看出细菌感染组高于其他二组。