公卫百科首页>> 公卫百科>> 医学统计 >>非参数统计

非参数统计
 
摘要: 在统计推断中,有些问题,如总体均数的区间估计、两个或多个均数的比较、相关系数和回归系数的假设检验等,大都是假定样本所来自的总体分布为已知的函数形式,但其中有的参数为未知。统计推断的目的就是对这些未知参数进行估计或检验。

在统计推断中,有些问题,如总体均数的区间估计、两个或多个均数的比较、相关系数和回归系数的假设检验等,大都是假定样本所来自的总体分布为已知的函数形式,但其中有的参数为未知。统计推断的目的就是对这些未知参数进行估计或检验。这类统计推断方法称为参数统计。在许多实际问题中,总体分布的函数形式往往不知道,或者知道得很少,例如只知道总体分布是连续型的或离散型的。这时参数统计方法就不适用,而需要借助于另一种不依赖总体分布的具体形式的统计方法,也就是说它不拘于总体分布,这种方法称为非参数统计或分布自由统计。非参数统计问世的时间不长,目前尚在发展中。

常用的非参数统计方法的主要优点是: ①不论样本所来自的总体分布的形式如何,甚至是未知的,都能适用。②某些非参数方法计算简便。因此,在急需获得初步结果时可采用之。③易于理解和掌握。④可用于不能或未加精确测量的资料,如等级资料或某些计数资料。

非参数统计的主要缺点是: ①对适宜用参数方法的资料,若用非参数法处理,常损失部分信息,降低效率。②虽然许多非参数法计算简便,但不少问题的计算仍嫌繁冗。

非参数统计适用于:①检验假设中没有包括总体参数;②资料不具备参数方法所需条件;③具有上述优点中②、④两种情况。(祝绍琪)

配对资料的符号检验及符号秩和检验

配对试验中,将每对(或同一)受试对象分别(或先后)给予两种不同的处理,比较两种处理的效果有无差别;或比较一组受试对象处理前后有无不同。凡配对计量资料或半计量资料不具备参数检验条件及适合非参数检验(见条目“非参数统计”)者,可用符号检验或符号秩和检验,后者效率较高。

符号检验 见条目 “样本中位数与总体中位数比较”。唯一不同的是将各对数据中,甲处理的数据大于乙处理者记为“+”,甲小于乙者记为“-”,甲等于乙者记为“0”。例1 接种某药的标准制剂和改良制剂后的红润区大小(cm2)见表1第(2)、(3)栏,试比较两种制剂的反应有无差别。

表1 配对资料符号检验的计算

(接种某药标准制剂与改良制剂后的红润区大小,cm2)

编 号
(1)

标准制剂Xi
(2)

改良制剂Yi
(3)

d=Xi-Yi的符号
(4)

1

2×3

5×8

 

2
3
4

0
1×1
0

0
0
0

0
+
0

5
6
7

0
4×5
1×1

0
1×1
0

0
+
+

8
9
10

2×4
2×3
0

2×3
2×3
0

+
0
0

11
12
13

2×3
1×1
3×5

3×5
0
2×4

-
+
+

14
15
16
17

3×4
5×7
4×5
3×5

1×1
2×3
1×1
2×3

+
+
+
+

H0:差值总体的中位数等于0,

H1:差值总体的中位数不等于0。

α=0.05。

差值的“+”、“-”及“0”见表1第(4)栏,其中有5个“0”,10个“+”,2个“-”,故n=10+2=12,K=2,查符号检验用K界值表,得P<0.05,按α=0.05水准拒绝H0,接受H1,故可认为两种制剂的接种反应有差别,改良制剂的反应较小。

符号秩和检验(F.Wilcoxon) 亦称配对秩和检验。方法步骤如下:

(1) 求各对数据(Xi,Yi)的差值di=Xi-Yi,如表3第(4)栏。

(2)依差值的绝对值从小到大编秩:1,2,3,…,并标明原差值的正负号。编秩时,若差值为0,弃去不计;若有几个差值的绝对值相等,则取其平均秩次。例如秩次6、7两个差值的绝对值相等,但前者为正,后者为负,两者的平均秩次为(6+7)/2=6.5,则前者编为+6.5,后者编为-6.5。

(3)分别求正、负秩次之和,并以绝对值较小者为统计量T值。以正、负差值的总个数为n。

(4) 以n及T查表2得P值,按所取检验水准作出推断结论。注意:当统计量T值恰等于表2中的界值时,其确切概率常小于表中相应的P值。

表2 符号秩和检验用T界值表

n

P(1):0.05
P(2):0.10

0.025
0.05

0.01
0.02

0.005
0.01

5

0

 

 

 

6

2

0

 

 

7

3

2

0

 

8
9
10

5
8
10

3
5
8

1
3
5

0
1
3

11
12
13
14
15

13
17
21
25
30

10
13
17
21
25

7
9
12
15
19

5
7
9
12
15

16
17
18
19
20

36
41
47
53
60

29
34
40
46
52

23
27
32
37
43

19
23
27
32
37

21
22
23
24
25

67
75
83
91
100

58
65
73
81
89

49
55
62
69
76

42
48
54
61
68

摘自 山内二郎:统計数值表,267,JSA-1972

本法的基本思想是假定两种处理的效应相同,则差值之总体分布是对称的,总体中位数为0;同理,假定某种处理无作用,则每一受试对象处理前后所得结果之差值的总体中位数亦为0。如果假设成立,则样本的正、负秩和应比较接近;若正、负秩和相差悬殊,即T特别小,则假设成立的可能性也小。从表2也可以看出:当n确定后,T值愈小,P值也愈小,因而可根据小概率事件来拒绝假设;反之,若P不小,则不能拒绝假设。

如n>25,表2查不到,可按式(1)计算μ值:

因为当n逐渐增大时,T值分布将逐渐逼近均数为

n(n+1)/4、标准差为布。遇相同秩次时,将标准差作式(2)的校正,即以式(2)取代式(1)中的分母。

式中ti为第i个相同秩次的个数。如有相同秩次:

例2 用两种饲料喂8对大白鼠后,测定其肝中维生素A的含量(iu/mg),结果见表3第(2)、(3)栏。问不同饲料组鼠肝中维生素A的含量有无差别?

表3 配对资料符号秩和检验的计算

[不同饲料组大白鼠肝中维生素A的含量(iu/mg)]

大白鼠对号
(1)

正常饲料组
(2)

缺乏维生素
E饲料组
(3)

差 值
(4)=(2)-(3)

秩次
(5)

1
2
3
4
5
6
7
8

3.55
2.00
3.00
3.95
3.80
3.75
3.45
3.05

2.45
2.40
1.80
3.20
3.25
2.70
2.50
1.75

1.10
-0.40
1.20
0.75
0.55
1.05
0.95
1.30

6
-1
7
3
2
5
4
8

-1,35

H0:差值的总体中位数为0,

H1:差值的总体中位数不为0。

a=0.05。

将表3第(4)栏按绝对值大小编秩,标明正负,见第(5)栏。分别计算正负秩和,得T=1。今n=8,查表2,得P<0.02,按a=0.05水准拒绝H0,接受H1,故可认为不同饲料所得大白鼠肝中维生素A的含量不同,维生素E缺乏组低于正常饲料组。

发表评价

词条信息

  • 浏览次数:6035 次
  • 发布时间: 2013-01-06
  • 更新时间: 2013-01-06

参与评价:

  • 词条内容仅供参考,如果您需要解决具体问题(尤其在法律、医学等领域),建议您咨询相关领域专业人士。
热门标签

中国疾病预防控制中心 版权所有 京ICP备11024750号-12
中国疾控中心信息中心 内容管理与技术支持 建议使用1024*768 分辨率,IE8.0以上
地址:北京市昌平区昌百路155号 邮编:102206