Poisson分布是一种重要的离散型分布,由法国数学家S.D.Poisson (1837)提出,常用于研究单位时间内(或单位空间内)某事件发生次数的分布。例如研究细菌、血细胞、粉尘等在单位面积或容积内计数结果的分布,放射性物质在单位时间内放射出质点数的分布,在单位空间中某些野生动物或昆虫数的分布,在一定人群中某种患病率很低的非传染性疾病的患病数或死亡数的分布,等等。
概率函数及图形 Poisson分布的概率函数为
式中λ为Poisson分布的总体均数,X为事件发生数。上述p(X)亦可用下式作递推计算:
Poisson分布的图形取决于λ,如图。
四种不同λ值的Poisson分布
性质
(1) Poisson分布的方差等于其均数λ。
(2) 当λ增大时,Poisson分布逐渐逼近于正态分布,这从上图可以看出。一般说来,当λ≥20时,Poisson分布的资料可按正态分布处理。
(3) 当n很大,p很小,np=λ为一常数时,二项分布近似于Poisson分布。p愈小,近似程度愈好。
(4)如果相互独立的k个随机变量都服从Poisson分布,则它们之和仍服从Poisson分布,且其均数为k个随机变量的均数之和。这一性质称为Poisson分布的可加性。
用途
(1) Poisson分布曲线的拟合。步骤:①先计算样本均数与方差;②如二者相等或相近,则可拟合Poisson分布曲线,按式(2)计算理论数;③拟合优度检验,可用x2检验,其自由度v等于组数减2。如例1。
(2)求总体均数λ的可信区间。当λ≤50时,可以从表1直接查得,如例2。当λ>50时,按性质(2),一般可用式(3)求近似的95%可信区间:
式中X为样本均数。如例3。
表1 Poisson分布λ的可信区间
样本 计数 X | 95% | 99% | 样本 计数 X | 95% | 99% | ||||
下限 | 上限 | 下限 | 上限 | 下限 | 上限 | 下限 | 上限 | ||
0 | 0.0 | 3.7 | 0.0 | 5.3 | |||||
1 2 3 4 5 | 0.1 0.2 0.6 1.0 1.6 | 5.6 7.2 8.8 10.2 11.7 | 0.0 0.1 0.3 0.6 1.0 | 7.4 9.3 11.0 12.6 14.1 | 26 27 28 29 30 | 17.0 17.8 18.6 19.4 20.2 | 38.0 39.2 40.4 41.6 42.8 | 14.7 15.4 16.2 17.0 17.7 | 42.2 43.5 44.8 46.0 47.2 |
6 7 8 9 10 | 2.2 2.8 3.4 4.0 4.7 | 13.1 14.4 15.8 17.1 18.4 | 1.5 2.0 2.5 3.1 3.7 | 15.6 17.1 18.5 20.0 21.3 | 31 32 33 34 35 | 21.0 21.8 22.7 23.5 24.3 | 44.0 45.1 46.3 47.5 48.7 | 18.5 19.3 20.0 20.8 21.6 | 48.4 49.6 50.8 52.1 53.3 |
11 12 13 14 15 | 5.4 6.2 6.9 7.7 8.4 | 19.7 21.0 22.3 23.5 24.8 | 4.3 4.9 5.5 6.2 6.8 | 22.6 24.0 25.4 26.7 28.1 | 36 37 38 39 40 | 25.1 26.0 26.8 27.7 28.6 | 49.8 51.0 52.2 53.3 54.5 | 22.4 23.2 24.0 24.8 25.6 | 54.5 55.7 56.9 58.1 59.3 |
16 17 18 19 20 | 9.4 9.9 10.7 11.5 12.2 | 26.0 27.2 28.4 29.6 30.8 | 7.5 8.2 8.9 9.6 10.3 | 29.4 30.7 32.0 33.3 34.6 | 41 42 43 44 45 | 29.4 30.3 31.1 32.0 32.8 | 55.6 56.8 57.9 59.0 60.2 | 26.4 27.2 28.0 28.8 29.6 | 60.5 61.7 62.9 64.1 65.3 |
21 22 23 24 25 | 13.0 13.8 14.6 15.4 16.2 | 32.0 33.2 34.4 35.6 36.8 | 11.0 11.8 12.5 13.2 14.0 | 35.9 37.2 38.4 39.7 41.0 | 46 47 48 49 50 | 33.6 34.5 35.3 36.1 37.0 | 61.3 62.5 63.6 64.8 65.9 | 30.4 31.2 32.0 32.8 33.6 | 66.5 67.7 68.9 70.1 71.3 |
摘自 Beyer WH: Handbook of Tables for Probabi-lity and Statistics,second edition,p239,CRCPress,Inc.,1979
(3) 二项分布的近似计算。由性质(3),当n很大,p很小,而np=λ为一常数时,二项分布可用Poisson分布作近似计算,从而简化运算,如例4。
(4)两样本均数的比较。目的是推断两个样本所代表的总体均数有无差别,可用u检验。如两样本观察单位数相等,用式(4);如不等,用式(5)。
式中∑X1、∑X2分别为两样本各观察单位的计数之和。如例5。
式中1为甲样本观察N1个单位的计数之均数,2为乙样本观察n2个单位的均数,n1≠n2。
(5) 间杂性检验。当进行k次计数时,可得到X1,X2,…,Xk个计数结果。这些计数结果是否从同一方差为λ的Poisson分布中随机抽取得来的? 若来自同一总体,说明总体无间杂性,反之,说明总体有间杂性,可用间杂性检验来回答这个问题。当X>5或k>15时,间杂性检验可用式(6)作x2检验,如例6。
例1 300个单位容积内的细菌计数结果如表2第(1)、(2)两栏。问此资料是否服从Poisson分布?
表2 Poisson分布的拟合与检验
*包括X为7以上的概率
本例: n=300,∑fX=747,∑fX2=2535。
两者相近,可试行拟合Poisson分布曲线,如表2,第(3)~(6)栏。第(4)栏系按式(2)求得。
拟合优度的x2检验
H0: 本资料服从Poisson分布。
H1: 本资料不服从Poisson分布。
α=0.05。
X2值计算如表2第(7)栏。v=7-2=5,查x2界值表,得0.50>P>0.05,按α=0.05水准不拒绝H0,故可认为本资料服从Poisson分布。
例2 从一份混合均匀的自来水中抽取1ml水样,培养出6个细菌,试估计每毫升自来水中细菌数的95%可信区间。
查表1,X=6(样本均数) 时,λ的95%可信区间2.2~13.1个/ml。
例3 某地普查20岁以上人群242575人,发现鼻咽癌133例,试估计该人群鼻咽癌患者总数的与患病率的95%可信区间。
患病总数的95%可信区间,按式(3)得
故患病率95%可信区间的
其区间为45.5/10万~64.1/10万。
例4 用一新药治疗某种寄生虫病。受试者50人在服药后有1人发生某种严重反应。这种反应在此病患者中也有发生,但过去普查结果约为每5000人中仅有1人出现。问此新药是否提高了这种反应的发生率?
H0: 服新药后有某种严重反应的发生率π=1/5000,
H1: π>1/5000。
单侧α=0.05。
按此检验假设,受试者50人在服药后发生该种反应的均数λ=nπ=50×1/5000=0.01。本例π很小,n较大,根据上述性质(3),可用Poisson分布作近似计算,受试者50人中无一发生该种反应的概率按式(2)为
p(0)=e-0.01=0.990050。于是50人中有人(题中虽只发生1例,但也应考虑发生1例以上的情形)发生严重反应的概率P为
P=1-p(0)=1-0.990050=0.009950。
按α=0.05水准拒绝H0,接受H1,故可认为服新药后的该种反应发生率高于一般情况。
例5 用甲乙两种培养基对水作细菌培养,每份水样均为1ml,各培养8次,得细菌个数如下:甲培养基分别为7,5,6,7,4,5,3,6; 乙培养基分别为9,8,8,10,7,7,7,9。试比较两种培养基的效果有无差别。
H0: λ1=λ2,H1: λ1≠λ2。
α=0.05。
今∑X1=43,ΣX2=65,n1=n2,按式(4),
查u界值表,得0.05>P>0.02,按α=0.05水准拒绝H0,接受H1,故可认为两种培养基的效果不同。
例6 在血细胞计数盘中对酵母细胞进行计数,共计18个方格,其结果为:2,3,5,7,3,8,5,4,1,4,4,6,4,5,4,8,3,5。此样本是否取自同一Poisson分布总体?
H0: 总体无间杂性,
H1: 总体存在间杂性。
α=0.05。
代入式(6),得
查x2界值表,得0.95>P>0.5,按α=0.05水准不拒绝H0,,故可认为总体无间杂性。
![]() |