正态分布又称高斯分布,是一种最重要的连续型分布。它是以均数为中心呈对称的钟型分布,如图1所示。早在1733年A. de Moivre首先提出这种分布的方程,他以此作为二项分布的极限形式。至19世纪初期,德国数学家C. F. Gauss与法国数学家P.S.de Laplace分别加以发展,用于研究观察误差的分布,但他们过分强调一切自然现象均服从正态分布。经半世纪之后K.Pearson论证,正态分布只是自然现象分布的一种形式。然而正态分布仍不失其重要意义。在医学科研中应用很广,也是许多统计方法建立的基础。
密度函数及其图形 正态分布的密度函数,即正态曲线的方程为
式中f(X)为与X对应的正态曲线的纵坐标高度。已知总体均数μ与总体标准差σ,就能按式(1)描绘出正态曲线,如图1(横轴下μ两侧数值前均省去μ),其分布函数为
式中F(X)为正态曲线下自-∞到X的面积。标准正态分布 如使式(2)右侧作变量变换:
式中u为标准正态变量,如此,则正态分布即可转化成标准正态分布。反映其纵坐标高度的密度函数成为
反映其面积的分布函数为
图形如图2。
正态分布常简记为N(μ,σ2),标准正态分布常简记为N(0,1)。标准正态变量的取值称为标准正态(离)差。性质
(1)正态分布的均数为μ,标准正态分布的均数为0。
(2) 正态分布的方差为σ2,标准正态分布的方差为1。
(3) 正态分布的三阶中心矩(即正态分布的偏度系数)为0。
(4)正态分布的四阶中心矩(即正态分布的峰度系数)为3σ4。
(5)面积规律。在正态曲线下,X轴上μ左右两侧各1σ 间的面积为68.27%,各 1.96σ 间的面积为95.00%,各2.58σ间的面积为99.00%,见图1。
图1 正态曲线及其面积分布
当X、μ与σ已知时,即可按式(3)求得u,按式(4)求得标准正态曲线的纵坐标高度φ(u),按式(5)求得自-∞到u的面积Φ(u),见图2。
图2 标准正态曲线的纵坐标与面积
已知u,求φ(u)与Φ(u)均有统计表可查,φ(u)值表见条目“正态曲线拟合”。求标准正态分布函数Φ(u)值可查表1。如u=-1.96时,查表1得 Φ(-1.96)=0.0250;但u为正时,如u=1.96,表中查不到,须用倒推法,即Φ(1.96)=1-Φ(-1.96)=1-0.0250=0.9750.
表1 标准正态分布曲线下的面积
[本表为自-∞到-u的面积Φ(-u),Φ(u)=1-Φ(-u)]
u | .00 | .01 | .02 | .03 | .04 | .05 | .06 | .07 | .08 | .09 |
-3.0 | .0013 | .0013 | .0013 | .0012 | .0012 | .0011 | .0011 | .0011 | .0010 | .0010 |
-2.4 | .0082 | .0080 | .0078 | .0075 | .0073 | .0071 | .0069 | .0068 | .0066 | .0064 |
-1.9 | .0287 | .0281 | .0274 | .0268 | .0262 | .0256 | .0250 | .0244 | .0239 | .0233 |
-1.4 | .0808 | .0793 | .0778 | .0764 | .0749 | .0735 | .0721 | .0708 | .0694 | .0681 |
-0.9 | .1841 | .1814 | .1788 | .1762 | .1736 | .1711 | .1685 | .1660 | .1635 | .1611 |
-0.4 | .3446 | .3409 | .3372 | .3336 | .3300 | .3264 | .3228 | .3192 | .3156 | .3121 |
本表按式(5)算得。
标准正态分布的分位数 标准正态曲线下,双侧尾部的面积P(2)或单侧尾部的面积P(1)为指定值α时,横轴上相应的u值记为uα,这就是u的分位数。P(2)、P(1)均可按式(6)求得。
这些数值有u界值表可查,兹节录部分常用者如表2。例如,当α=0.05时,双侧u0.05=1.960,单侧u0.05=1.6449≐1.645。
表2 标准正态分布的分位数简表(u界值表)
P(1): | 0.25 | 0.10 | 0.05 | 0.025 | 0.01 | 0.005 |
u | 0.6745 | 1.2816 | 1.6449 | 1.9600 | 2.3263 | 2.5758 |
用途 正态分布的用途很广,如
(1)众多微小且独立的随机因素(其中没有一个是主导的)影响的总结果,一般表现为正态分布(中心极限定理)。如随机误差的分布,某些生理现象的频率分布等,都可认为是正态分布。
(2)某些统计量的抽样分布,如x2、t与F分布都是在正态分布的基础上推导出来的。
(3)某些分布,如二项分布、Poisson分布、t分布等的极限为正态分布。
(4) u检验。以u作为统计量的假设检验称为u检验,它是最常用的一种检验方法。
(5)服从正态分布资料的正常值范围估计,半数效量的计算,质量控制图的绘制等。
![]() |