以百分数p代入式(1)或式(2)即可算得其logit函数值y,称logit变换。
为避免出现负值,郭祖超按式(3)编制了百分数由0.1%~99.9%的logit值表,摘录如表1。
logit变换主要用于S形或反S形曲线的直线化。
表1 百分数p与logit值对照表
p(%) | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 |
0 |
| 2.70 | 3.05 | 3.26 | 3.41 | 3.53 | 3.62 | 3.71 | 3.78 | 3.84 |
10 | 3.90 | 3.95 | 4.00 | 4.05 | 4.09 | 4.13 | 4.17 | 4.21 | 4.24 | 4.27 |
本表按式(3)算得。
S形曲线直线化的logit变换法: 当原数据X与p的散点图呈S形或反S形曲线趋势时,取p的logit变换值y,若X与y呈直线趋势,直线化即获成功;若尚未达到直线趋势,一般多呈指数曲线形,可用(X±K)取代X,再行直线化,K是尝试所得校正数。最后作曲线拟合。例 用家兔研究甲胎蛋白诊断肝癌。X为抗体血清稀释度的倒数,p为结合率,原数据见表2第(1)、(4)栏。欲求X推算p的回归方程,试用适当变换使观察点呈直线趋势。
表2 logit变换计算表
X 部 分 | y 部分 | |||
X | lgX | lg(X+800) | p(%) | y |
20 | 1.30 | 2.91 | 47 | 4.94 |
表2变量X为几何级数,宜取lgX,见第(2)栏,以第(2)、(4)栏数据作散点图,呈反S形曲线趋势,见图1。
图1 表2第(2)、(4)栏数据的散点图
按式(3)将p变换为logit值y,如p=47%时:
或查表1,左侧为“40”的行与上端为“7”的列交叉处即可得到。全部y值列于第(5)栏。用第(2)、(5)栏数据作散点图,略呈指数曲线趋势。经尝试,以lg(X+800)与y的观察点直线性较优。按第(3)、(5)栏数据作图,得图2上呈直线趋势的观察点。变换值可用于求由X推算p的回归方程。
lg(X+800)
图2 观察点的直线化(数据见表2第(3)、(5)栏)
S形曲线直线化的三种变换之比较: logit变换、概率单位变换和平方根反正弦变换,用于百分数资料S形曲线的直线化方面作用很相似,但强弱不等。图3是按相同
图3 logit变换、概率单位变换及反正弦变换的比较
的百分数p设计的,范围是1%~99%,分别用三种方法进行变换,以表示它们之间的差别。logit值的曲线弯曲度最大,表明作用最强,适用于S形曲线弯曲度较大的资料; 平方根反正弦值的曲线弯曲度最小,表明作用最弱,适用于S形曲线弯曲度较小的资料;概率单位值的曲线介于二者之间,表明作用居中。按设计,三条曲线有共同的起止点,而当p=50%时,它们都通过同一坐标点,表明三种变换的直线化作用在50%的两端是对称的。应用时,须根据资料的特点选择不同的变换。当所用方法的直线化效果不佳时,应分析其原因属作用“太弱”抑或“过强”,再改用适当方法。
![]() |