随机事件有各种不同的结果,变量X按不同结果而取不同的值,且X服从一定的概率分布,这样的变量称为随机变量,它是随机事件的数量化。随机变量的分布型常用的有离散型与连续型两种,均可用分布函数表达随机变量的概率性质。但在许多实际问题中,有时很难精确地求出其分布函数,或只需要知道某一、二个描述分布特征的数字指标(称数字特征)就够了。常用的数字特征有数学期望、方差、矩等。
离散型分布 如果随机变量X只能取有限个数值X1,X2,…,Xn;或无限可数个数值X1,X2,…,Xn,…,就说X为离散型随机变量。当X=Xk (其中k=1,2,…)时的概率记作p(Xk),∑p(Xk)=1。p(X)称为概率函数。则X的取值及其对应的概率可按一定次序一一列举,例如以某种动物作某药的毒性试验时,已知其死亡率为60%。则4个动物作该药的毒性试验时死亡X只及其对应的概率为
动物死亡数X | 0 | 1 | 2 | 3 | 4 |
对应的概率p(Xk) | 0.0256 | 0.1536 | 0.3456 | 0.3456 | 0.1296 |
当随机变量取值不大于X时的累计概率记作P(X)=
称为离散型分布函数,如本例,动物死亡数
不大于2只的累计概率为
P(2)=p(0)+p(1)+p(2)
=0.0256+0.1536+0.3456=0.5248。
二项分布、Poisson分布、超几何分布等都是离散型分布。一般说来,离散型分布多用于计数资料。
连续型分布 例如成年男子的身高,人的寿命等不是离散型随机变量。对非离散型随机变量,由于其可能取的值不能一个一个地列举出来,因而转为研究随机变量的取值不超过X (注: 本分卷中X既表示随机变量也表示它所取的值)的概率,称为分布函数,记作F(X)。如果随机变量X的分布函数F(X)能够表示为
就说X为连续型随机变量,式中非负函数f(X)称为此分布函数(或分布,或随机变量)的密度函数,简称密度。例如某市120名12岁男孩身高(cm)的频率分布服从正态分布,其均数为143.1cm,标准差为5.67cm,则它的密度为
该市12岁男孩身高不超过143.1+5.67=148.77cm的概率为
严格地说,式(1) 应表示为
对于某些常见分布,已知X求F(X)值有统计表可查,如上例可由标准正态分布曲线下的面积表查得(见条目“正态分布”)。正态分布、x2分布、Weibull分布等都是连续型分布。一般说来,连续型分布多用于计量资料。
数学期望 设有一个含量为n的样本,观察值X1 ,X2,…,Xk的权数依次为,f1,f2,…,fk,则其均数为
当n充分大时,频率fi/n接近于概率。从这个加权均数的启发,我们定义离散型随机变量X的数学期望E(X)为
E(X)=∑Xp(X)。(3) 式中∑p(x)=1,并要求E(X)为一确定的数值。由此可见,数学期望就是总体均数,常简记为μ。
类似地,对具有密度函数f(X)的连续型随机变量,有
这里同样要求E(X)为一确定的数值。
方差 数学期望刻划了随机变量的集中位置,进而刻划它的变异程度的有方差。对于离散型随机变量X的方差定义为
V(X)=E[X-E(X)]2=∑(X-μ)2p(X); (5)对于连续型的,定义为
式(5)与(6)中都要求V(X)是一个确定的数值。
有了数学期望(总体均数)与方差的定义就可按上列公式,计算随机变量的数字特征。例如当X服从二项分布时,可按式(3)、(5),求得它的数学期望为nπ,方差为nx(1-x); 当X服从正态分布时,可按式(4)、(6)求得E(X)=μ,V(X)=σ2。本分卷中以σ2表示服从任何分布的随机变量的方差,即σ2=V(X)。
矩(动差) 随机变量X的k阶中心距,记作μk,对离散型定义为
μk=∑(X-μ)kp(X); (7)
对连续型定义为
当μ=0时,k阶中心矩就称为k阶原点矩,记作μ′k,对离散型与连续型分别为
这里要求μk和μ′k都是确定的数值。当k=1时,μ′1就是X的数学期望。当k=2时,μ2就是X的方差。三阶矩可刻划分布的偏度,四阶矩可刻划分布的峰度。
![]() |