正交多项式是将多项式回归方程
Y=a0+a1X+a2X2+…+akXk (1)
中的X,X2,…,Xk进行适当变换,相应地变成ψ1(X),ψ2(X),…,ψk(X),于是上述回归方程变为
Ŷ=b0ψ0(X)+b1ψ1(X)+…+bkψk(X), (2)
式中每个ψi(X)是X的i次多项式,亦即ψ1(X),ψ2(X),…,ψk(X)分别是X的一次、二次及k次多项式。设X是等间隔取值,则可使X1=1,X2=2,…,Xt=t,…Xn=n。如果Xi=a+h,X2=a+2h,…,Xn=a+nh,则作变换x=X-a/h就可得x1=1,x2=2,…,xn=n;k
为多项式的最高方次,n为样本含量。为简化运算,选择ψi(X),使
这两条性质称为正交性,可以验证下面一组多项式满足上述正交性。故这组多项式称为正交多项式。
由于Ψi(X)(i=1,2,…,k)的值不一定都为整数,为了计算方便,引进适当的系数λi,使
φi=φi(x)=λiΨi(X) ,(5)在n个等间隔点上的值都为整数。对给定的n,相应的λi及φi在第1,2,…,n各点的数值与si=∑φ2i都已制成了正交多项式表供实际计算之用,如表1是摘录n为5 ~8的正交多项式表,详表见有关统计表。
表1 正交多项式表(n为5~8 )
t | n | 5 | 6 | 7 | 8 | Φ1 | Φ2 | Φ3 | Φ4 | Φ1 | Φ2 | Φ3 | Φ4 | Φ5 | Φ1 | Φ2 | Φ3 | Φ4 | Φ5 | Φ1 | Φ2 | Φ3 | Φ4 | Φ5 | |||||||||||||||||||||||||||||||||||||||||||||
1 | -2 | 2 | -1 | 1 | -5 | 5 | -5 | 1 | -1 | -3 | 5 | -1 | 3 | -1 | -7 | 7 | -7 | 7 | -7 | ||||||||||||||||||||||||||||||||||||||||||||||||||
si | 10 | 14 | 10 | 70 | 70 | 84 | 180 | 28 | 252 | 28 | 84 | 6 | 154 | 84 | 168 | 168 | 264 | 616 | 2184 |
温度(℃) X | 5 | 10 | 15 | 20 | 25 | 30 | 35 |
血糖值(mg/dl)Y | 130 | 120 | 91.5 | 89 | 107.5 | 122.5 | 147.5 |
表3 正交多项式计算表
X | x | Φ1 | Φ2 | Φ3 | Y | Y2 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
5 | 1 | -3 | +5 | -1 | 130.0 | 16900.00 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Bi=∑ΦiY | 73.5 | 434.5 | -1 | 808.0 95912.00 | si | 28 | 84 | 6 | n=7 | λi | 1 | 1 | 1/6 |
变异来源 | SS | v | MS | F |
总 | 2645.7143 | 6 |
|
|
回归:一次 | 192.9375 | 1 | 192.9375 | 2.82 |
三次 | 0.1667 | 1 | 0.1667 | <1 |
2440.6072 | 3 | |||
剩 余 | 205.1071 | 3 | 68.37 |
|
a=0.05水准,可认为二次项对Y有贡献,三次项没有贡献。故宜配二次正交多项式,按式(9)及式(4)得
本例由表3,得b0=115.4286,b1=2.625,b2=5.173,λ1=1,λ2=1, =(1+7)/2=4, x=X/5, n=7。代入方程,并化简得所求的回归方程:
将各X值代入上式可得各相应的估计值Y如下,列出实测值Y以资比较。
X | 5 | 10 | 15 | 20 | 25 | 30 | 35 |
Y | 130 | 120 | 91.5 | 89 | 107.5 | 122.5 | 147.5 |
Ŷ | 133.42 | 110.18 | 97.28 | 94.73 | 102.52 | 120.66 | 149.14 |
按(X,Ŷ)绘曲线如图,图中黑点是观察值(X,Y)。
室温与家兔血糖值的关系
a
![]() |