公卫百科首页>> 公卫百科>> 医学统计 >>总体均数估计

总体均数估计
 
摘要: 总体均数的估计有点估计和区间估计。点估计是用样本均数来估计总体均数; 区间估计是求出总体均数的可能范围,方法随总体标准差是否已知而异



总体均数的估计有点估计和区间估计。点估计是用样本均数来估计总体均数; 区间估计是求出总体均数的可能范围,方法随总体标准差是否已知而异: 总体标准差未知时按t分布原理计算; 总体标准差已知时按正态分布原理计算。此外,亦可用平方根纸图解求总体均数的可信区间。

总体均数的可信区间

(1)总体标准差未知时,一般按式(1)或式(2)计算可信区间。当样本含量n较大时,比如n>50,亦可按式(3)作近似计算,n越大,近似程度越好。因为根据统计量t的抽样分布原理:

式中μ为总体均数,为样本均数, S为样本标准差,N为样本含量。T的抽样分布曲线表明: 在界值-TΑ,V和TΑ,V以外的面积为Α,如T≤-T0.05,V和T≥T0.05,V的概率为 Α=0.05; 而在此两界值以内的面积为1-Α,如-T0.05,V<T<T0.05,V的概率为1-0.05=0.95,即

于是得可信度为1-α 时计算总体均数的可信区间的通式为

或写成

式中tα,v是按自由度v=n-1由t界值表查得,如95%可信区间最为常用,即取α=0.05。

当v为无限大时,t分布呈正态分布,实用上当样本含量足够大时,式(2)可近似地用式(3)来代替,即

式中uα。为可信度是1-α的标准正态(离)差,可由u界值表查得。如计算95%可信区间,u0.05 =1.96;计算99%可信区间,u0.01 =2.58。

(2)总体标准差已知时,按式(4)计算可信区间。由于实际工作中,总体标准差常为未知,故本法少用。

若从正态总体作随机抽样,当总体标准差σ已知时,统为标准正态分布,故总体均数的1-α可信区间为

式中uα的意义同式(3)。式(4)和式(3)的区别仅在式(4)中用σ,式(3)中用s。

例1 某矿对11名无矽肺矿工测血清铜蓝蛋白含量(活性单位/dl),算得均数为6.5,标准差为1.36,试估计无矽肺矿工血清铜蓝蛋白的总体均数。

本例n=11, =6.5, S=1.36,自由度V=11-1=10。若取95%可信区间,则Α=0.05,查T界值表T0.05,10=2.228,按式(2):

故无矽肺矿工血清铜蓝蛋白的点估计为6.5活性单位/dl,其95%可信区间为5.59~7.41活性单位/dl。

例2 某地500名健康成人末梢血液白细胞均数为7291个/mm3,标准差为1695个/mm3,试估计该地健康成人白细胞均数。

本例n=500, =7291,S=1695,若取95%可信区间, U0.05=1.96,按式(3):

故该地健康成人末梢血液白细胞均数的点估计为7291个/mm3,其95%可信区间为7142~7440个/mm3

两总体均数差值的可信区间 经假设检验,已知两样本均数X12有差别,而两样本方差S21与S22的差别无显著性时,须进一步估计两总体均数差值的大小。则以两样本均数之差|1-2|作为点估计。 用式(5)作区间估计。

式中n1、n2分别为两样本含量,s1、s2分别为两样本标准差,s1-2为两样本均数之差的标准误。

例3 分别用甲、乙两药治疗某病患者,甲药治40人,乙药治38人。测得患者某指标的均数与标准差S, 甲药1=4.0,S1=0.6;乙药2=5.4, S2=0.8。 试估计两总体均数的差值。本例 N1=40, N2=38; 1=4.0, 2=5.4; S1=0.6,S2 =0.8。

查t界值表,t0.05,76=1.99,

(1.4-1.99×0.16,1.4+1.99×0.16)=(1.1,1.7)。

两总体均数差值的点估计为1.4,95%可信区间为1.1~1.7。

发表评价

词条信息

  • 浏览次数:13019 次
  • 发布时间: 2013-01-06
  • 更新时间: 2013-01-06

参与评价:

  • 词条内容仅供参考,如果您需要解决具体问题(尤其在法律、医学等领域),建议您咨询相关领域专业人士。
热门标签

中国疾病预防控制中心 版权所有 京ICP备11024750号-12
中国疾控中心信息中心 内容管理与技术支持 建议使用1024*768 分辨率,IE8.0以上
地址:北京市昌平区昌百路155号 邮编:102206