公卫百科首页>> 公卫百科>> 医学统计 >>两样本比较的秩检验

两样本比较的秩检验
 
摘要: 本法利用两样本观察值的秩来推断两样本分别代表的总体的位置有无差别 (即两总体的变量值有无倾向性的不同)。检验假设H0是两总体分布相同,备择假设H1是两总体的位置不同。



本法利用两样本观察值的秩来推断两样本分别代表的总体的位置有无差别 (即两总体的变量值有无倾向性的不同)。检验假设H0是两总体分布相同,备择假设H1是两总体的位置不同。常用Wilcoxon秩和检验及Ma-nn-Whitney秩检验。适用于计量资料或等级资料,但如资料符合t检验的条件,则本法的效率不及t检验高。Wilcoxon秩和检验(F. Wilcoxon,1945) 方法步骤如下:

(1) 编秩。以n1和n2分别代表两样本含量,并规定n1≤n2。将两样本的全部观察值统一由小到大排列,标以秩次; 凡属不同样本的相等观察值一律取原秩次的平均秩次。

(2) 求秩和T。以样本含量为n1组的秩和为统计量T。若n1=n2,可取任一组之秩和为T。

(3) 以n1、n2-n1及T查表1得P值,按所取检验水准作出推断结论。查表时,若统计量T值在某一行的上、下界值范围内,其P值大于表中相应的P;若T值在上、下界值范围外,其P值小于表中相应的P;若T值恰等于上、下界值,其P值小于表中相应的P值。

表1 秩和检验用T界值表

 

P(1)

P(2)

每组 1行
2行
3行
4行

0.05
0.025
0.01
0.005

0.10
0.05
0.02
0.01

n1
(较小者)

n2-n1

0

1

2

3

4

5

6

7

8

9

10

2

 

 

 

3~13

3~15

3~17

4~18
3~19

4~20
3~21

4~22
3~23

4~24
3~25

5~25
4~26

3

6~15

6~18

7~20
6~21

8~22
7~23

8~25
7~26
6~27

9~27
8~28
6~30

10~29
8~31
7~32
6~33

10~32
9~33
7~35
6~36

11~34
9~36
7~38
6~39

11~37
10~38
8~40
7~41

12~39
10~41
8~43
7~44

4

11~25
10~26

12~28
11~29
10~30

13~31
12~32
11~33
10~34

14~34
13~35
11~37
10~38

15~37
14~38
12~40
11~41

16~40
14~42
13~43
11~45

17~43
15~45
13~47
12~48

18~46
16~48
14~50
12~52

19~49
17~51
15~53
13~55

20~52
18~54
15~57
13~59

21~55
19~57
16~60
14~62

(续表)

n1
(较小者)

n2-n1

0

1

2

3

4

5

6

7

8

9

10

5

19~36
17~38
16~39
15~40

20~40
18~42
17~43
16~44

21~44
20~45
18~47
16~49

23~47
21~49
19~51
17~53

24~51
22~53
20~55
18~57

26~54
23~57
21~59
19~61

27~58
24~61
22~63
20~65

28~62
26~64
23~67
21~69

30~65
27~68
24~71
22~73

31~69
28~72
25~75
22~78

33~72
29~76
26~79
23~82

6

28~50
26~52
24~54
23~55

29~55
27~57
25~59
24~60

31~59
29~61
27~63
25~65

33~63
31~65
28~68
26~70

35~67
32~70
29~73
27~75

37~71
34~74
30~78
28~80

38~76
35~79
32~82
30~84

40~80
37~83
33~87
31~89

42~84
38~88
34~92
32~94

44~88
40~92
36~96
33~99

46~92
42~96
37~101
34~104

7

39~66
36~69
34~71
32~73

41~71
38~74
35~77
34~78

43~76
40~79
37~82
35~84

45~81
42~84
39~87
37~89

47~86
44~89
40~93
38~95

49~91
46~94
42~98
40~100

52~95
48~99
44~103
41~106

54~100
50~104
45~109
43~111

56~105
52~109
47~114
44~117

58~110
54~114
49~119
46~122

61~114
56~119
51~124
47~128

8

51~85
49~87
45~91
43~93

54~90
51~93
47~97
45~99

56~96
53~99
49~103
47~105

59~101
55~105
51~109
49~111

62~106
58~110
58~115
51~117

64~112
60~116
56~120
53~123

67~117
62~122
58~126
54~130

69~123
65~127
60~132
56~136

72~128
67~133
62~138
58~142

75~133
70~138
64~144
60~148

77~139
72~144
66~150
62~154

9

66~105
62~109
59~112
56~115

69~111
65~115
61~119
58~122

72~117
68~121
63~126
61~128

75~123
71~127
66~132
63~135

78~129
73~134
68~139
65~142

81~135
76~140
71~145
67~149

84~141
79~146
73~152
69~156

87~147
82~152
76~158
72~162

90~153
84~159
78~165
74~169

93~159
87~165
81~171
76~176

96~165
90~171
83~178
78~183

10

82~128
78~132
74~136
71~139

86~134
81~139
77~143
73~147

89~141
84~146
79~151
76~154

92~148
88~152
82~158
79~161

96~154
91~159
85~165
81~169

99~161
94~166
88~172
84~176

103~167
97~173
91~179
86~184

106~174
100~180
93~187
89~191

110~180
103~187
96~194
92~198

113~187
107~193
99~201
94~206

117~193
110~200
102~208
97~213

摘自山内二郎:統計数值表,269,JSA-1972

本法的基本思想是假设含量分别为n1与n2的两样本,各来自分布相同的两个总体,则n1样本的T与其平均秩和n1(N+1)/2应相差不大(N=n1+n2),若相差悬殊,超出了所取检验水准的界值范围(如表1),表示抽得现有样本统计量T值的概率P很小,因而拒绝假设; 相反,若P不小,则不能拒绝假设。

设含量为n1和n2两样本的秩和分别为T1和T2,则式(1)可用于检查计算有无错误,

n1或n2-n1超出表1范围时可用式(2)计算u值,以正态近似法作出推断。

当相同秩次较多时,比如在观察值较多,尤其在等级资料中,常采用频数表作秩和检验,以各组段的平均秩次代表该组段的所有观察值,如表3。则式(2)的分母须代以式(3)作校正,

式中ti为第i个相同秩次的个数。

例1 测得铅作业与非铅作业工人的血铅值(μg/100g)如表2第(1)、(3)栏,已从小到大排列,试检验两组血铅值有无差别。H0:铅作业工人血铅值的总体分布与非铅作业工人的相同,

H1:铅作业工人血铅值高于非铅作业工人。

表2 两组工人血铅值的秩和检验

非铅作业组
(1)

秩 次
(2)

铅作业组
(3)

秩 次
(4)

5
5
6
7
9
12
13
15
18
21

1
2
3
4
5
6
7
8
10.5
13

17
18
20
25
34
43
44

9
10.5
12
14
15
16
17

n2=10

T2=59.5

n1=7

T1=93.5

单侧α=0.05。

编秩。将全部17个观察值从小到大标出其秩次,见表2第(2)、(4)栏;两组中各有一个18,因分属两组,均取原秩次10及11的均数10.5。

求秩和。以样本含量较少组的秩和为T=93.5。用式(1)检查计算结果:93.5+59.5=153,表明计算无误。

查表1。单侧检验,当n1=7,n2=10,n2-n1=10-7=3时,93.5在37~89之外,得P<0.005,按α=0.05水准拒绝H0,接受H1,故可以认为铅作业工人的血铅值高于非铅作业工人。例2 用某药治疗不同病情的老年慢性支气管炎病人,疗效见表3第(1)、(2)栏。试比较两种病情的疗效。

表3 某药对两种病情支气管炎的疗效之秩和检验

疗 效

单纯性
(1)

单纯性合并
肺气肿
(2)

合 计
(3) =(1)+(2)

秩次范围
(4)

平均秩次
(5)

秩 和

单纯性
(6)=(1)(5)

合并肺气肿
(7)=(2)(5)

控 制
显 效
有 效
无 效

65
18
30
13

42
6
23
11

107
24
53
24

1~107
108~131
132~184
185~208

54
119.5
158
196.5

3510
2151
4740
2554.5

2268
717
3634
2161.5

合 计

126

82

208

——

——

12955.5

8780.5

H0:两种病情病人的疗效总体分布相同,H1:两种病情病人的疗效不同。

a=0.05。

编秩。此例疗效依次分为四个等级,各等级的病人总数见表3第(3)栏。疗效为“控制”者共有65 + 42 =107人,应占秩次1~107,这107人属同一等级,不能分列高低,故一律以其平均秩次(1+107)/2=54代表;余类推,全部秩次范围及平均秩次分列于第(4)、(5)栏。

求秩和。分别将第(5)栏乘第(1)、(2)栏人数,相加即得两组各自的秩和,见第(6)、(7)栏。如用式(1)检查:8780.5+12955.5=21736,(208)(208+1)/2=21736,说明计算无误。

此例n1=82,n2=126,n2-n1=44,已超出表1所列范围,可由式(2)求u值。又由于此资料的相同秩次很多,须按式(3)作校正。计算过程如表4。

表4 表3资料相同秩次的校正计算

等级
i

相同秩次个数
ti

t3i

t3i-ti

控 制
显 效
有 效
无 效

107
24
53
24

1225043
13824
148877
13824

1224936
13800
148824
13800

合 计

208

 

1401360

查u界值表得P>0.5,按a=0.05水准不拒绝H0,故认为本疗法对上述两种病情的患者并未显示出不同疗效。

Mann-Whitney秩检验(H. B. Mann,D. R. Whi-tney,1947) 先编秩次,同Wilcoxon秩和检验;再以含量为n1的样本中每一秩次为准,数出含量为n2的样本中秩次大于此每一秩次的个数,如遇秩次相同时,按1/2计,其合计为统计量U(非标准正态变量u),查U界值表(见参考书目),或用式(5)将U变换为T值后查表1得P值。

若再以含量为n2的样本为准,同法可得U2。将前一个U记为U1,则U1+U2 =n1n2,可用于检查计算的正误。

当U界值表查不到(n1>20,n2>40)时,可用式(4)计算u值,以正态近似法作出推断。

当相同秩次较多时,式(4)的分母仍以式(3)作校正。式(4)的分母(标准差)与式(2)的分母相同。

例3 用Mann-Whitney法检验例1资料。

H0、H1与a同例1。

在表2上,先以含量为n1的样本之秩次为准,数出n2样本的秩次中

≥9的有2个(10.5,13),

≥10.5的有1.5个(10.5,13), ≥12的有1个(13),≥14及以上的有0个,故U1 =2+1.5+1+0=4.5。

再以含量为n2的样本之秩次为准,数出n1样本的秩次中≥秩次1,2,…,8的都有7个(9,10.5,12,14,15,16,17),≥秩次10.5的有5.5个(10.5,12,14,15,16,17),≥秩次13的有4个(14,15,16,17),故U2=7×8+5.5+4=65.5。

核算得 4.5+65.5=70,7×10=70。说明计算无误。

查U界值表(从略),得P值,结论同例1。

Wilcoxon秩和检验与Mann-Whithey秩检验是等价的。即对同一资料,用任一检验所得的P值相等,结论相同。它们的关系如下:

如例1,T=93.5,代入式(5)得

与例3中计算得的U1相同。同理,由例3中求得的U=4.5,可按式(5)计算得T=93.5 (同例1),如此可查表1(不必查U界值表)得P值并作结论。

参考书目 山内二郎:统计数值表,274,JSA-1972

发表评价

词条信息

  • 浏览次数:10949 次
  • 发布时间: 2013-01-06
  • 更新时间: 2013-01-06

参与评价:

  • 词条内容仅供参考,如果您需要解决具体问题(尤其在法律、医学等领域),建议您咨询相关领域专业人士。
热门标签

中国疾病预防控制中心 版权所有 京ICP备11024750
中国疾控中心信息中心 内容管理与技术支持 建议使用1024*768 分辨率,IE8.0以上
地址:北京市昌平区昌百路155号 邮编:102206 热线电话:13911841040