公卫百科首页>> 公卫百科>> 医学统计 >>曲线拟合优度的比较

曲线拟合优度的比较
 
摘要: 一组双变量资料,如果呈现某种非直线回归关系,而其总体的数学形式尚未确定时,往往可以用几个不同的方程估计其总体,再比较不同方程拟合的优度,进行选择。



一组双变量资料,如果呈现某种非直线回归关系,而其总体的数学形式尚未确定时,往往可以用几个不同的方程估计其总体,再比较不同方程拟合的优度,进行选择。常用的比较有两种,即相互比较和逐步比较,视拟合的曲线类型而定。均用F检验。

相互比较 用于回归的自由度相等时。如拟合直线回归方程与指数曲线方程的比较,或拟合指数曲线方程与双曲线方程的比较。F检验时的检验假设为两个剩余方差(即估计误差均方)相等,统计量F值的计算按式(1)。

式中剩余平方和可由观察值Y与回归值Y直接计算,亦可由离均差平方和计算,结果相同(见“多元线性回归”)。由于规定将较大方差作分子,较小方差作分母,则F值必然大于1,故应查方差齐性检验用F界值表得P值;若查方差分析用F界值表,则应将表中的P值加倍,如表中P=0.05的界值,此时应为P=0.10的界值,同理表中P=0.01的界值,此时应为P=0.02的界值。查得P值后,按所取检验水准作出推断结论。若拒绝两剩余方差相等的假设,则应选剩余方差较小的曲线方程;若不拒绝假设可选用其中的任一方程,而实际工作中常选剩余方差较小者。

逐步比较 用于回归的自由度递减时。如拟合多项式曲线,随着回归方程方次的升高,自由度v将递减,如直线回归的v=n-2 ,二次曲线回归的v=n-3,三次曲线回归的v=n-4。同时,计算亦愈趋复杂。故在拟合曲线的过程中,常需了解方程的方次升高后是否增进了拟合优度,增进的程度如何? 这就是逐步比较要解决的问题。比较时的F检验步骤:

(1)作检验假设为曲线方程递增一次对拟合优度无改进。即减少的估计误差的均方等于升高一次的方程的剩余方差。

(2)计算方次相邻的两个曲线方程之剩余平方和,算法同上。

(3) 计算二者之差,即减少误差的平方和。

(4) 按式(2)计算统计量F值。

(5)查方差分析用F界值表得P值,按所取检验水准作出推断结论。若P<α,则拒绝检验假设,可认为曲线方程递增一次后减少的误差有显著性,常需拟合高一次的曲线方程;若P>a,则不拒绝假设,可认为减少的误差无显著性,拟合低一次的曲线方程即可(参见“正交多项式”)。

应用本法的条件是: ①拟合任何曲线必须表明此曲线关系是有实际意义的。②根据资料的性质选定适当曲线类型,在拟合曲线之后,再进行拟合优度检验或拟合优度比较的检验。③在①和②的前提下,常选取剩余方差较小的曲线,作比较时并不一定要达到惯用的检验水准。④同一资料拟合的适用曲线有时不止一条。

例1 用狗作藜芦素的毒性试验,心率(次/分钟)X越快,致死量(μg/g心重)Y越小,见表1第(1)、(2)栏。已得直线回归方程和指数曲线回归方程如下:

经拟合优度检验,上述关系均成立。试比较二者的拟合优度。

H0: 两回归方程的剩余方差相等,

H1: 两回归方程的剩余方差不等。

α=0.05。

分别计算两个方程的回归值Ŷ,如表1第(3)、(4)栏,回归线见图1。两个回归方程拟合优度的相互比较的F检验见表2。

将较大剩余方差除以较小剩余方差,得F值,查方差齐性检验用F界值表,得P>0.05按a=0.05水准不拒绝H0,故可认为此资料拟合直线或指数曲线都是有效的。然而从方差大小和图形上看,仍以指数曲线的优度稍好。

例2 按1975年若干城市9~17岁女子的平均体重资料及拟合的直线回归和二次、三次、四次多项式曲线回归方程如下(为

表1 拟合回归后的估计误差

X
(1)

Y
(2)

直线Ŷ
(3)

曲线Ŷ
(4)

98
100
102
107
112
115
126
144
165
188
190
191
197
∑(Y-Ŷ)Ŷ

39.3
42.2
35.2
29.1
16.4
26.9
29.5
18.2
14.7
12.9
16.6
12.4
8.7

33.6
33.1
32.7
31.5
30.3
29.6
26.9
22.6
17.5
12.0
11.5
11.3
9.9

38.9
36.6
34.6
31.0
28.3
26.9
23.1
18.8
15.3
12.5
12.3
12.2
11.6

391.24

245.88

图1 拟合直线与指数曲线的比较

表2 直线与指数曲线拟合优度的比较

变异来源

v

∑(Y-Ŷ)2

MS

F

直 线
指数曲线

11
11

391.24
245.88

35.57
22.35

1.59

简化计算,取X=X′-9),试对各次方程的拟合优度作逐步比较。

H0: 曲线方次递升一次后减少的估计误差之均方等于升一次曲线的剩余方差,

H1: 曲线方次递升一次后减少的估计误差之均方大于升一次曲线的剩余方差。

α=0.05。

先按此四个方程作图,如图2。可见三次和四次曲线的拟合优度甚好,直线和二次曲线不佳。用F检验作逐步比较,见表3。

直线

二次曲线

三次曲线

四次曲线

图2 拟合直线、二次、三次、四次曲线的比较

表3 直线、二次、三次和四次曲线拟合优度的逐步比较

变异来源

v

∑(Y-Ŷ)2

MS

F

P

二次曲
线比直
线

直 线

7

9.5644

 

 

 

二次曲线

6

5.6228

0.93713

 

 

1

3.9416

3.9416

4.206

>0.05

三次曲
线比二
次曲线

二次曲线

6

5.6228

 

 

 

三次曲线

5

0.1488

0.02976

 

 

1

5.4740

5.4740

183.938

<0.01

四次曲
线比三
次曲线

三次曲线

5

0.1488

 

 

 

四次曲线

4

0.1270

0.03175

 

 

1

0.0218

0.0218

0.687

>0.05

结合图2和F检验的结果可看出: 二次曲线的拟合优度比直线者有所增进,但按a=0.05水准尚未拒绝H0;三次曲线的拟合优度比二次者有很大增进; 四次曲线的拟合优度比三次者无明显增进,可见拟合三次曲线已达到良好的优度。

发表评价

词条信息

  • 浏览次数:9400 次
  • 发布时间: 2013-01-06
  • 更新时间: 2013-01-06

参与评价:

  • 词条内容仅供参考,如果您需要解决具体问题(尤其在法律、医学等领域),建议您咨询相关领域专业人士。
热门标签

中国疾病预防控制中心 版权所有 京ICP备11024750
中国疾控中心信息中心 内容管理与技术支持 建议使用1024*768 分辨率,IE8.0以上
地址:北京市昌平区昌百路155号 邮编:102206 热线电话:13911841040