公卫百科首页>> 公卫百科>> 医学统计 >>百分位数

百分位数
 
摘要: 百分位数是一种位置指标,以符号Px表示。一个百分位数将总体或样本的全部观察值分为两部分,理论上有x%的观察值比它小,有(100-x)%的观察值比它大。如含量为n的样本,取第5百分位数P5,理论上有n×5%个观察值比P5小,有n(100-5)%个观察值比P5大,故百分位数是一个界值。它的计算方法有频数表法和图解法。

百分位数是一种位置指标,以符号Px表示。一个百分位数将总体或样本的全部观察值分为两部分,理论上有x%的观察值比它小,有(100-x)%的观察值比它大。如含量为n的样本,取第5百分位数P5,理论上有n×5%个观察值比P5小,有n(100-5)%个观察值比P5大,故百分位数是一个界值。它的计算方法有频数表法和图解法。

对于某一连续的分布函数,当指定x%后,Px即为定值; 而对于一组原始数据如100例由小到大排列的正常成人发汞值(μg/g): 2.2,2.3,…,2.6,2.7,2.8,3.0,4.0,4.3,其P95不是恰等于某一观察值,只能说P95在2.6与2.7之间,因为任何介于2.6与2.7之间的数,都具有95%的观察值比它小,5%的观察值比它大的特性。当P1,P2,P3,…,P99确定后,一个由小到大的有序数列即被分为100等份,各含1%的观察值,所以百分位数也就是该序列的百等份分割值。

统计上某些其他的分割值与相应的百分位数等价。如中位数(1883年F. Galton首用此名)将一序列的全部观察值二等分,上下各有1/2的观察值,与P50等价。四分位数将一序列的全部观察值四等分,各有1/4的观察值,其第1四分位数(亦称下四分位数)、第2四分位数(即中位数)、第3四分位数(亦称上四分位数)依次与P25,P50,P75等价。十分位数将一序列的全部观察值十等分,各有1/10的观察值,其第1十分位数,第2十分位数,……,第9十分位数,依次与P10,P20,…,P90等价。这些分割值都可按求百分位数的方法来计算。

百分位数的用途是: ①描述一组资料(样本或总体观察值)在某百分位置上的水平。②百分位数就是分布数列的百分界值,表示它的上下各有百分之几的观察值,常用于确定医学正常值以及身体发育水平等的界限。③在假设检验中用作拒绝或不拒绝检验假设的界值。④用一组百分位数,如P5,P25,P75,P95,可以描述总体或样本的分布特征,包括位置值的大小和变异度。

百分位数并非由全部观察值综合计算得来,因此它不如均数和标准差精确; 然而中间部分的百分位数因不受资料中个别极端数据的影响,具有较好的稳定性。但靠近两端的百分位数,只在样本含量足够大时才比较稳定,因此,当样本含量不够大时,不宜取太近两端的百分位数。至于样本含量过少时,“百分”位数已经名不符实,应用价值也就很小了。

频数表法 步骤: ①将观察值编制频数表; ②按所分组段,由小到大累计频数,至略小于nx%为止; ③按式(1)求Px



式中fx为nx%所在组段的频数,i为该组段的组距,L为其下限,∑fL为小于L各组段的累计频数。若上述第②步按所分组段由大到小累计频数,至略小于n(100-x)%为止,则改用式(2)求Px


式中fx为n(100-x)%所在组段的频数,i为该组段的组距,U为其上限,∑fU为大于U的各组段的累计频数。同一频数表资料由式(1)或式(2)算得的结果相等,因为式(1)式(2)都是根据补插法原理,两个补插的“点”在理论上应重合。应用时,当Px的x<50时用式(1)较方便,x>50时用式(2)较方便。

图解法 步骤: ①将观察值编制频数表; ②求累计频数及累计频率(%)如表第(4)、(5)栏; ③在方格坐标纸上,以横轴表示频数表的组段,纵轴表示累计频率,依累计频率连成线图; ④从纵轴上累计频率x%处作一水平线与图中折线相交,过交点作垂线交于横轴,此处的横坐标即所求百分位数 (如图)。图解法用图示代替补插计算,道理相同,但一般不及计算准确。由图可见,特别是靠近线的尾端较平坦部分,准确性较差。如果仅作粗略估计,尤其同时要估计多个百分位数时,用图解法颇方便。

例 某种沙门菌食物中毒患者164例的潜伏期见表第 (1)、(2)栏,求其95%分位数。

潜伏期P95的计算



(1)频数表法: 求P95时,x=95>50,按式(2)计算较方便。n(100-95)%=164(100-95)%=8.2,依组段由大到小的方向累计频数,见表第(3)栏下部,至略小于8.2为止,可见8.2在“48~”组段内,得fx=12,i=12,U=60,∑fu=6,代入式(2):


得此次食物中毒潜伏期的第95百分位数为57.8小时。

本例若按式(1)计算,依组段由小到大的方向累计频数,至略小于n(95%)=164×95%=155.8为止,见表第(3)栏上部,代入式(1):


结果相同。

(2) 图解法: 先求累计频数及累计频率,见表第(4)、(5)栏,再将第(1)、(5)栏数据作图,得折线(见图)。于纵轴95%处作水平线,交于折线,从交点作垂线,目测其与横轴交点的横坐标约58小时,即所求P95


图解法求百分位数


发表评价

词条信息

  • 浏览次数:25191 次
  • 发布时间: 2012-12-17
  • 更新时间: 2012-12-17

参与评价:

  • 词条内容仅供参考,如果您需要解决具体问题(尤其在法律、医学等领域),建议您咨询相关领域专业人士。
热门标签

中国疾病预防控制中心 版权所有 京ICP备11024750
中国疾控中心信息中心 内容管理与技术支持 建议使用1024*768 分辨率,IE8.0以上
地址:北京市昌平区昌百路155号 邮编:102206 热线电话:13911841040