正交试验是一种高效、快速的多因素试验方法。它是利用一套规格化的正交表,使每次试验的因素及水平得到合理的安排,通过试验结果的分析,获得有用的信息。医学现象一般是比较复杂的多因素问题,而各种因素本身尚有程度的差别,其间往往又存在交互作用。例如按某种指标要求摸索培养某种病毒所需的最优条件。如表1已知有四个影响因素A、B、C、D,每个因素各有二个
表1 培养某种病毒的试验因素及水平
试验因素 | 水 | 平 |
温度 (A) | 33℃(A1) | 37℃(A2) |
水平(即等级),A1,A2; B1,B2; C1,C2; D1,D2。本试验要解决的问题是: ①找出各因素对指标的影响,并指出哪个是主要的,哪个是次要的,哪个起独立作用,哪个起交互作用。②选出各因素中的一个最佳水平,组成培养某病毒的最优条件。
设计 正交试验的设计主要通过正交表。正交表是合理安排试验和数据分析的主要工具。如表2即3因素2水平8次试验的正交表。列号1、2、3可安排A、B、C三个因素,表中1、2即1水平和2水平,左列是试验号。如第1次试验A、B、C均安排1水平,第2次试验A、B为1水平,C为2水平。按此设计模型作试验。每个表的表头有一个符号,如L4(23)、L9(34)、L12(211)、L16(45)等等。符号L代表正交表,L下标4、9、12、16代表试验次数,括号内的2、3、2、4代表水平数,指数位置3、411、5代表最多容许安排试验因素的个数。从表2可看到正交表有两个性质: ①各列中不同数字出现的次数相等,如A列1与2均各出现4次;②任意两列同一横行的两个数字搭配均匀。如A、B两列八个横行中1、1,1、2,2、1,2、2四种对子各出现两次。以上两种性质说明正交设计充分表现了它的均衡性。
表2 L8(23)正交表
试验号 | 列 号 | 1(A) | 2(B) | 3(C) | ||
1 | 1 | 1 | 1 |
选用正交表的方法是: ①根据研究目的,确定试验的因素,选出其中几种主要因素。②确定每个因素的水平,各因素的水平数可以相等,也可不等,主要因素的水平数可以多些,次要的可以少些。③根据主客观条件,决定试验次数。例如,表1是培养某病毒四因素二水平的试验。选正交表的方法是:
如只考虑A、B、C三个因素及其交互作用,可选L8(27)表,表头设计如下:
列号 | 1 | 2 | 3 | 4 | 5 | 6 | 7 |
如四个因素都要考虑,而各因素间交互作用可能不大,则使交互作用混在一起不单独提出,亦可选L8(27)表,表头设计如下:
列号 | 1 | 2 | 3 | 4 | 5 | 6 | 7 |
因素 | A | B | A×B | C | A×C | B×C | D |
如四个因素都要考虑,各因素所有两两交互作用也要考虑,可选L16(215)表,表头设计如下:
列号 | 1 | 2 | 3 | 4 | 5 | 6 | 7 |
|
因素 | A | B | A×B | C | A×C | B×C |
|
|
列号 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 |
如只考虑三个因素,不考虑交互作用,每因素的水平增到3个时,可选L9(34)表,表头设计如下:
列 号 | 1 | 2 | 3 | 4 |
如考虑四个因素,A、B、D各取四个水平,C取二个水平,可选L1(43 ×26)表, A、 B、 C放在前三列, D放在第4~9列中任一列,表头设计如下:
列号 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 |
可见选用正交表时要: ①先看水平数,如全是二水平,可选L4(23),L8(27),L12(211),L16(215),L32(231) 等表;全是三水平,可选L9(34),L18(37),L27(313),L36(313)等表;全是四水平,可选L16(45),L32(43)等表; 全是五水平,可选L25(56)等表; 五水平以上可用正交拉丁方。水平不等时,可选L8(4×24),L16(42×29),L18(2×37)等表。②根据试验要求决定试验次数。要求精确度高时,可选试验次数多的正交表; 要求精确度不高或试验条件有困难时,可选试验次数少的正交表。③分析的交互作用多,选列多的正交表;已知交互作用小,选列少的正交表。④正交表中列的占用,如果用方差分析,至少要空一列以估计误差,如用直观分析粗略估计,可不空列。
分析 正交试验的分析有直观分析与方差分析两种。1. 直观分析。将试验结果按正交表直接计算出每一因素各水平观察指标的平均值,找出各因素中最佳水平,如后例。此法可粗略地说明各因素诸水平间的差别,简单直观,但不能确切地判断各因素间的交互作用,也不能估计误差,就不能说明分析的精度。
2. 方差分析。比直观分析精确,可以补其不足。方法如下:
(1)作检验假设。有两种: 一是每一因素各水平间的比较,H0为某因素各水平的总体均数相等; 二是分析有无交互作用,H0为两因素间无交互作用。
(2)将总变异的离均差平方和及其自由度分为各因素的各水平间、两因素的交互作用及误差等几个部分。设试验共有N个观察值X,重复试验次数为q,如表4N=40,q=5;在正交表上某因素(或交互作用、误差)各水平的重复数为r,如表3A1重复2次,即r=2;求出各行的合计如表4“合计”栏,将与r次重复相对应的“合计”相加得K,如表5第(2)栏。则计算离均差平方和SS及自由度v的公式为:
式(3)中∑(K)2为某因素各水平K值的平方和。交互作用或误差的SS亦可仿此计算。
SS误差=SS总减所有因素、交互作用、误差之离均差平方和,
v=总变异的v减相应各部分的自由度。
(3)分别计算各因素及交互作用的均方MS(=SS/v),并与误差的均方相比得F值,如表6。
(4)查F界值表得P值,按所取检验水准作出推断结论。
例 在蛇毒抑瘤试验中,有三个试验因素: 蛇毒成分(峰)A、瘤株B、剂量C。A有四个水平,B、C各有两个水平:
A1=Ⅻ峰、A2=Ⅰ峰、A3=Ⅷ峰、A4=原毒,
B1=小白鼠肉瘤(S180)、B2=小白鼠艾氏腹水瘤,
C1=剂量0(对照)、C2=剂量0.075mg/kg体重。
不考虑交互作用。观察指标为瘤重(g)。试作正交试验,找出最优组合条件。
1. 设计。选用L8(4 × 24)表(表3左侧)安排试验:表3的1,
表3 L8(4 × 24)表及5鼠重复试验的合计瘤重
试验号 | 列 号 | 瘤重(g) | 1(A) | 2(B) | 3(C) | 4 | 5 | ||||
1 | 1 | 1 | 1 | 1 | 1 | 8.8 |
2,3三列分别安排A,B,C;4,5两列作为计算误差用。为减少实验误差的干扰,每次试验用5头小白鼠作重复试验。按表3,第一次试验A、B、C均安排1水平,5头小白鼠的试验结果见表4第1行; 第2次试验,A为1水平,B、C均为2水平,5头小白鼠的试验结果见表4第2行;余仿此。全部试验结果见表4 。再将表4各行 “合计”抄录于表3右侧供分析用。
表4 5次重复试验的小白鼠瘤重(g)
试验号 | 受试鼠号 | 合 计 | 1 | 2 | 3 | 4 | 5 | ||||
1 | 1.5 | 2.0 | 1.6 | 2.0 | 1.7 | 8.8 | |||||
|
|
|
|
| 40.3 |
2. 分析。
(1)直观分析。见表5,第(2)栏K为表3中每一因素各水平对应的“瘤重”相加,如表3中: A1是安排在A列的第1、2次试验,对应的“瘤重”为8.8及3.0,相加得K=11.8; B1是安排在B列的第1、3、5、7次试验,对应的“瘤重”为8.8、7.3、3.5及3.0,相加得K =22.6;余仿此。再以每一因素各水平共用的动物数除之即得平均瘤重见表5第(4)栏。由此可直观看出,四个峰值按其抑瘤作用的效果依次为A3(Ⅷ峰),A4 (原毒),A2(Ⅰ蜂),A1(Ⅻ蜂);瘤株以B2 (艾氏腹水瘤)较为敏感,剂量以C2(0.075mg/kg体重)的抑瘤作用较好。
(2) 方差分析。
A因素四个水平间:
H0: μ1=μ2=μ3=μ4,
H1: μ1、μ2、μ3、μ4不等或不全相等。
B因素二个水平间:
H0: μ1 =μ2,
H1: μ1≠μ2;
C因素二个水平间:
表5 每一因素各水平的平均瘤重
因素及水平 | 总瘤重,K | 动物数 | 平均瘤重(g) |
A1 | 11.8 | 10 | 1.18 |
41 | 22.7 | 20 |
|
H0: μ1=μ2,
H1: μ1≠μ2。
均取α=0.05。
由表4及表5资料,按式(1)~(3):
表6 方差分析
查F界值表得P值,见表6。
结论: 蛇毒组A间、瘤株B间和剂量C间,按α=0.05水准均拒绝H0,接受H1。表明: 蛇毒抑瘤作用以成分Ⅷ峰、瘤株艾氏腹水瘤、剂量0.075mg/kg体重的组合条件为最好。