以原数据的对数值作为统计分析的变量值,称对数变换。当原数据具有倍数的关系时,其对数值将具有差数的关系,后者便于进行统计分析。一般取常用对数变换:
x=lgX。(1)
M. S. Bartlett建议用式(2)作对数变换,尤其当原数据中有小值以及零值时较适用。
x=lg(X+1)。(2)
亦可根据需要选用下列变换式:
x=lg(X+K),(3)
或 x=lg(K-X),(4)
式中K为常数。
对数变换常用于: ①当几个样本均数作比较时,若几个样本方差不齐,尤其是标准差与均数之比的比值接近时,须经对数变换以缩小各方差间的差别,达到方差齐性后才能进行t检验或方差分析。②有些原数据的对数值呈正态分布,称为对数正态分布,即用对数变换能使此类资料正态化。③在曲线拟合中,对数变换常是直线化的一种重要手段,如指数曲线、双曲线、logistic曲线的直线化等。
例 欲用t检验比较某河水丰水期和枯水期浅层水生化耗氧量(mg/L)的均数,资料见表。此数据能否直接用于t检验?若不能,试作适当变换。
对数变换计算表
生化耗氧量(mg/L),X | lg X+1 | ||
丰水期 | 枯水期 | 丰水期 | 枯水期 |
0.24 0.54 0.50 0.34 0.40 0.76 0.30 0.20 | 1.99 0.99 1.22 1.17 1.96 0.71 1.25 1.23 | 0.38021 0.73239 0.69897 0.53148 0.60206 0.88081 0.47712 0.30103 | 1.29885 0.99564 1.08636 1.06819 1.29226 0.85126 1.09691 1.08991 |
合计 3.28 均数 0.41 方差 0.0339 | 10.52 1.315 0.1978 | 4.60407 0.57551 0.03698 | 8.77938 1.09742 0.02150 |
先对原数据X作方差齐性检验。检验方法参见条目 “两个方差的齐性检验”,得F=0.1978/0.0339=5.835,查方差齐性检验用F界值表,P<0.05,按α=0.05水准,可认为两组方差不齐,不能直接用t检验。两样本的“标准差/均数”: 丰水期为,枯水期为
,二者接近,可试用对数变换。对原数据作“lgX+1”变换后再作方差齐性检验,得F=0.03698/0.02150=1.72,P>0.05,按α=0.05水准,两组方差为齐性。可用变换值(见表右侧)作两样本均数比较的t检验。
![]() |