45
第 5 章 正交试验
设计
领导形象设计圆作业设计ao工艺污水处理厂设计附属工程施工组织设计清扫机器人结构设计
方法
5.1 试验设计方法概述
试验设计是数理统计学的一个重要的分支。多数数理统计方法主要用于分析已经得到
的数据,而试验设计却是用于决定数据收集的方法。试验设计方法主要讨论如何合理地安
排试验以及试验所得的数据如何分析等。
例 5-1 某化工厂想提高某化工产品的质量和产量,对工艺中三个主要因素各按三个水
平进行试验(见表 5-1)。试验的目的是为提高合格产品的产量,寻求最适宜的操作条件。
对此实例该如何进行试验
方案
气瓶 现场处置方案 .pdf气瓶 现场处置方案 .doc见习基地管理方案.doc关于群访事件的化解方案建筑工地扬尘治理专项方案下载
的设计呢?
很容易想到的是全面搭配法方
案(如图 5-1 所示):
此方案数据点分布的均匀性极
好,因素和水平的搭配十分全面,唯
一的缺点是实验次数多达 33=27 次
(指数 3 代表 3 个因素,底数 3 代表
每因素有 3 个水平)。因素、水平数
愈多,则实验次数就愈多,例如,做一个 6 因素 3 水平的试验,就需 36=729 次实验,显然
难以做到。因此需要寻找一种合适的试验设计方法。
试验设计方法常用的术语定义如下。
试验指标:指作为试验研究过程的因变量,常为试验结果特征的量(如得率、纯度等)。
例 1 的试验指标为合格产品的产量。
因素:指作试验研究过程的自变量,常常是造成试验指标按某种规律发生变化的那些
原因。如例 1 的温度、压力、碱的用量。
水平:指试验中因素所处的具体状态或情况,又称为等级。如例 1 的温度有 3 个水平。
温度用 T 表示,下标 1、2、3 表示因素的不同水平,分别记为 T1、T2、T3。
常用的试验设计方法有:正交试验设计法、均匀试验设计法、单纯形优化法、双水平
单纯形优化法、回归正交设计法、序贯试验设计法等。可供选择的试验方法很多,各种试
表 5-1 因素水平
水平
因素 温度℃ 压力 Pa 加碱量 kg
符号 T p m
1
2
3
T1 (80 )
T2(100)
T3(120)
p1(5.0)
p2(6.0)
p3(7.0)
m 1(2.0)
m2(2.5)
m3(3.0)
图 5-1 全面搭配法方案
46
验设计方法都有其一定的特点。所面对的任务与要解决的问题不同,选择的试验设计方法
也应有所不同。由于篇幅的限制,我们只讨论正交试验设计方法。
5.2 正交试验设计方法的优点和特点
用正交表安排多因素试验的方法,称为正交试验设计法。其特点为:①完成试验要求
所需的实验次数少。②数据点的分布很均匀。③可用相应的极差分析方法、方差分析方法、
回归分析方法等对试验结果进行分析,引出许多有价值的结论。
从例 1可看出,采用全面搭配法方案,需做 27次实验。那么采用简单比较法方案又如
何呢?
先固定 T1 和 p1,只改变 m,观察因素 m 不同水平的影响,做了如图 2-2(1)所示的三
次实验,发现 m=m2 时的实验效果最好(好的用 □ 表示),合格产品的产量最高,因此
认为在后面的实验中因素 m应取 m2 水平。
固定 T1 和 m2,改变 p 的三次实验如图 5-2(2)所示,发现 p=p3时的实验效果最好,
因此认为因素 p应取 p3水平。
固定 p3和 m2,改变 T 的三次实验如图 5-2(3)所示,发现因素 T 宜取 T2水平。
因此可以引出结论:为提高合格产品的产量,最适宜的操作条件为 T2p3m2。与全面搭配
法方案相比,简单比较法方案的优点是实验的次数少,只需做 9 次实验。但必须指出,简
单比较法方案的试验结果是不可靠的。因为,①在改变 m 值(或 p 值,或 T 值)的三次实
验中,说 m2(或 p3或 T2 )水平最好是有条件的。在 T ≠T1,p ≠p1时,m2 水平不是最好
的可能性是有的。②在改变 m的三次实验中,固定 T =T2,p =p3 应该说也是可以的,是
随意的,故在此方案中数据点的分布的均匀性是毫无保障的。③用这种方法比较条件好坏
时,只是对单个的试验数据进行数值上的简单比较,不能排除必然存在的试验数据误差的
干扰。
运用正交试验设计方法,不仅兼有上述两个方案的优点,而且实验次数少,数据点分
布均匀,结论的可靠性较好。
正交试验设计方法是用正交表来安排试验的。对于例 1 适用的正交表是 L9(3
4),
其试验安排见表 5-2。
所有的正交表与 L9(3
4)正交表一样,都具有以下两个特点:
(1) 在每一列中,各个不同的数字出现的次数相同。在表 L9(3
4)中,每一列有三
个水平,水平 1、2、3 都是各出现 3 次。
(2) 表中任意两列并列在一起形成若干个数字对,不同数字对出现的次数也都相同。
在表 L9(3
4)中,任意两列并列在一起形成的数字对共有 9 个:(1,1),(1,2),(1,3),(2,1),
(2,2),(2,3),(3,1),(3,2),(3,3),每一个数字对各出现一次。
图 5-2 简单比较法方案
情案
47
L 9(3
4)
正交表的列数
每一列的水平数
实验的次数
正交表的代号
表 5-2 试验安排表
试验号
列号 1 2 3 4
因素 温度℃ 压力 Pa 加碱量 kg
符号 T p m
1
2
3
4
5
6
7
8
9
1(T1)
1(T1)
1(T1)
2(T2)
2(T2)
2(T2)
3(T3)
3(T3)
3(T3)
1(p1)
2(p2)
3(p3)
1(p1)
2(p2)
3(p3)
1(p1)
2(p2)
3(p3)
1(m1)
2(m2)
3(m3)
2(m2)
3(m3)
1(m1)
3(m3)
1(m1)
2(m2)
1
2
3
3
1
2
2
3
1
这两个特点称为正交性。正是由于正交表具有上述特点,就保证了用正交表安排的试
验方案中因素水平是均衡搭配的,数据点的分布是均匀的。因素、水平数愈多,运用正交
试验设计方法,愈发能显示出它的优越性,如上述提到的 6 因素 3 水平试验,用全面搭配
方案需 729 次,若用正交表 L27(3
13)来安排,则只需做 27 次试验。
在化工生产中, 因素之间常有交互作用。 如果上述的因素 T 的数值和水平发生变化
时,试验指标随因素 p 变化的规律也发生变化,或反过来,因素 p 的数值和水平发生变化
时,试验指标随因素 T 变化的规律也发生变化。这种情况称为因素 T、p 间有交互作用,记
为 T×p 。
5. 3 正交表
使用正交设计方法进行试验方案的设计,就必须用到正交表。正交表请查阅有关参考书。
5.3.1 各列水平数均相同的正交表
各列水平数均相同的正交表,也称单一水平正交表。这类正交表名称的写法举例如下:
各列水平均为 2 的常用正交表有:L4(2
3),L8(2
7),L12(2
11),L16(2
15),L20(2
19),
L32(2
31)。
各列水平数均为 3 的常用正交表有:L9(3
4),L27(3
13)。
各列水平数均为 4 的常用正交表有:L16(4
5)
各列水平数均为 3 的常用正交表有:L25(5
6)
48
5.3.2 混合水平正交表
各列水平数不相同的正交表,叫混合水平正交表,下面就是一个混合水平正交表名称
的写法:
L 8(4
1×24)常简写为 L 8(4×2
4)。此混合水平正交表含有 1 个 4 水平列,4 个 2 水
平列,共有 1+4=5 列。
5.3.3 选择正交表的基本原则
一般都是先确定试验的因素、水平和交互作用,后选择适用的 L 表。在确定因素的水
平数时,主要因素宜多安排几个水平,次要因素可少安排几个水平。
(1)先看水平数。若各因素全是 2 水平,就选用 L(2*)表;若各因素全是 3 水平,就
选 L(3*)表。若各因素的水平数不相同,就选择适用的混合水平表。
(2)每一个交互作用在正交表中应占一列或二列。要看所选的正交表是否足够大,能
否容纳得下所考虑的因素和交互作用。为了对试验结果进行方差分析或回归分析,还必须
至少留一个空白列,作为“误差”列,在极差分析中要作为“其他因素”列处理。
(3)要看试验精度的要求。若要求高,则宜取实验次数多的 L 表。
(4)若试验费用很昂贵,或试验的经费很有限,或人力和时间都比较紧张,则不宜选
实验次数太多的 L 表。
(5)按原来考虑的因素、水平和交互作用去选择正交表,若无正好适用的正交表可选,
简便且可行的办法是适当修改原定的水平数。
(6)对某因素或某交互作用的影响是否确实存在没有把握的情况下,选择 L 表时常为
该选大表还是选小表而犹豫。若条件许可,应尽量选用大表,让影响存在的可能性较大的
因素和交互作用各占适当的列。某因素或某交互作用的影响是否真的存在,留到方差分析
进行显著性检验时再做结论。这样既可以减少试验的工作量,又不致于漏掉重要的信息。
5.3.4 正交表的表头设计
所谓表头设计,就是确定试验所考虑的因素和交互作用,在正交表中该放在哪一列的
问题。
(1)有交互作用时,表头设计则必须严格地按规定办事。因篇幅限制,此处不讨论,
请查阅有关书籍。
(2)若试验不考虑交互作用,则表头设计可以是任意的。如在例 5-1 中,对 L 9(3
4)
表头设计,表 5-3 所列的各种方案都是可用的。但是正交表的构造是组合数学问题,必须满
足 5.2 中所述的特点。对试验之初不考虑交互作用而选用较大的正交表,空列较多时,最好
仍与有交互作用时一样,按规定进行表头设计。只不过将有交互作用的列先视为空列,待
L 8(4
1×24)
2 水平列的列数为 4
4 水平列的列数为 1
实验的次数
正交表的代号
49
试验结束后再加以判定。
5.4 正交试验的操作方法
(1)分区组。对于一批试验,如果要使用几台不同的机器,或要使用几种原料来进行,
为了防止机器或原料的不同而带来误差,从而干扰试验的分析,可在开始做实验之前,用 L
表中未排因素和交互作用的一个空白列来安排机器或原料。
与此类似,若试验指标的检验需要几个人(或几台机器)来做,为了消除不同人(或
仪器)检验的水平不同给试验分析带来干扰,也可采用在 L 表中用一空白列来安排的办法。
这样一种作法叫做分区组法。
(2)因素水平表排列顺序的随机化。如在例 5-1 中,每个因素的水平序号从小到大时,
因素的数值总是按由小到大或由大到小的顺序排列。按正交表做试验时,所有的 1 水平要
碰在一起,而这种极端的情况有时是不希望出现的,有时也没有实际意义。因此在排列因
素水平表时,最好不要简单地按因素数值由小到大或由大到小的顺序排列。从理论上讲,
最好能使用一种叫做随机化的方法。所谓随机化就是采用抽签或查随机数值表的办法,来
决定排列的别有顺序。
(3)试验进行的次序没必要完全按照正交表上试验号码的顺序。为减少试验中由于先
后实验操作熟练的程度不匀带来的误差干扰,理论上推荐用抽签的办法来决定试验的次序。
(4)在确定每一个实验的实验条件时,只需考虑所确定的几个因素和分区组该如何取
值,而不要(其实也无法)考虑交互作用列和误差列怎么办的问题。交互作用列和误差列
的取值问题由实验本身的客观规律来确定,它们对指标影响的大小在方差分析时给出。
(5)做实验时,要力求严格控制实验条件。这个问题在因素各水平下的数值差别不大
时更为重要。例如,例 5-1 中的因素(加碱量)m 的三个水平:m1=2.0,m2=2.5,m3=3.0,
在以 m=m2=2.5 为条件的某一个实验中,就必须严格认真地让 m2=2.5。若因为粗心和不负
责任,造成 m2=2.2 或造成 m2=3.0,那就将使整个试验失去正交试验设计方法的特点,使极
差和方差分析方法的应用丧失了必要的前提条件,因而得不到正确的试验结果。
5.5 正交试验结果分析方法
正交试验方法之所以能得到科技工作者的重视并在实践中得到广泛的应用,其原因不
仅在于能使试验的次数减少,而且能够用相应的方法对试验结果进行分析并引出许多有价
值的结论。因此,有正交试验法进行实验,如果不对试验结果进行认真的分析,并引出应
该引出的结论,那就失去用正交试验法的意义和价值。
表 5-3 L 9(3
4)表头设计方案
列 号 1 2 3 4
方 案
1
2
3
4
T
空
m
p
p
T
空
m
m
p
T
空
空
m
p
T
50
5.5.1 极差分析方法
下面以表 5-4 为例讨论 L4(2
3)正交试验结果的极差分析方法。极差指的是各列中各水
平对应的试验指标平均值的最大值与最小值之差。从表 5-4 的计算结果可知,用极差法分析
正交试验结果可引出以下几个结论:
(1)在试验范围内,各列对试验指标的影响从大到小的排队。某列的极差最大,表示
该列的数值在试验范围内变化时,使试验指标数值的变化最大。所以各列对试验指标的影
响从大到小的排队,就是各列极差 D 的数值从大到小的排队。
(2)试验指标随各因素的变化趋势。为了能更直观地看到变化趋势,常将计算结果绘
制成图。
(3)使试验指标最好的适宜的操作条件(适宜的因素水平搭配)。
(4)可对所得结论和进一步的研究方向进行讨论。
5.5.2 方差分析方法
5.5.2.1 计算公式和项目
试验指标的加和值=
n
i
iy
1
,试验指标的平均值
n
i
iy
n
y
1
1
,以第 j列为例:
表 5-4 L4(2
3)正交试验计算
列 号 1 2 3 试验指标 yi
试验号
1
2
3
n=4
1
1
2
2
1
2
1
2
1
2
2
1
y1
y2
y3
y4
Ⅰj
Ⅱj
kj
Ⅰj/ kj
Ⅱj/ kj
极差(Dj)
Ⅰ1=y1+y2
Ⅱ1=y3+y4
k1=2
Ⅰ1/ k1
Ⅱ1/ k1
max{ }-min{ }
Ⅰ2=y1+y3
Ⅱ2=y2+y4
k2=2
Ⅰ2/ k2
Ⅱ2/ k2
max{ }-min{ }
Ⅰ3=y1+y4
Ⅱ3=y2+y3
k3=2
Ⅰ3/ k3
Ⅱ3/ k3
max{ }-min{ }
注:
Ⅰj ——— 第 j 列“1”水平所对应的试验指标的数值之和;
Ⅱj ——— 第 j 列“2”水平所对应的试验指标的数值之和;
kj ——— 第 j 列同一水平出现的次数。等于试验的次数(n)除以第 j列的水平数。
Ⅰj/ kj ——— 第 j 列“1”水平所对应的试验指标的平均值;
Ⅱj/ kj ——— 第 j 列“1”水平所对应的试验指标的平均值;
Dj ——— 第 j 列的极差。等于第 j 列各水平对应的试验指标平均值中的最大值减
最小值,即
Dj=max{Ⅰj/ kj ,Ⅱj/ kj ,… }-min{ Ⅰj/ kj ,Ⅱj/ kj ,… }
51
⑴ Ⅰj __ “1”水平所对应的试验指标的数值之和
⑵ Ⅱj —— “2”水平所对应的试验指标的数值之和
⑶ ……
⑷ kj —— 同一水平出现的次数。等于试验的次数除以第 j列的水平数
⑸ Ⅰj/ kj —— “1”水平所对应的试验指标的平均值
⑹ Ⅱj/ kj —— “1”水平所对应的试验指标的平均值
⑺ ……
以上 7 项的计算方法同极差法(见表 5-4)。
⑻ 偏差平方和
222
IIIIII
y
k
ky
k
ky
k
kS
j
j
j
j
j
j
j
j
jj
⑼ fj ——自由度。fj =第 j列的水平数-1。
⑽ Vj ——方差。Vj =Sj /fj 。
⑾ Ve ——误差列的方差。Ve =Se /fe 。式中,e为正交表的误差列。
⑿ Fj ——方差之比 Fj =Vj /Ve 。
⒀ 查 F分布数值表(F分布数值表请查阅有关参考书)做显著性检验。
⒁ 总的偏差平方和
n
i
i yyS
1
2
总
⒂ 总的偏差平方和等于各列的偏差平方和之和。即
m
j
jSS
1
=总
式中,m为正交表的列数。
若误差列由 5个单列组成,则误差列的偏差平方和 Se等于 5个单列的偏差平方和之和,
即:Se =Se1 +Se2 +Se3 +Se4 +Se5 ;也可用 Se =S 总 +S
,,来计算,其中 S,,为安排有因
素或交互作用的各列的偏差平方和之和。
5.5.2.2 可引出的结论
与极差法相比,方差分析方法可以多引出一个结论:各列对试验指标的影响是否显著,
在什么水平上显著。在数理统计上,这是一个很重要的问题。显著性检验强调试验在分析
每列对指标影响中所起的作用。如果某列对指标影响不显著,那么,讨论试验指标随它的
变化趋势是毫无意义的。因为在某列对指标的影响不显著时,即使从表中的数据可以看出
该列水平变化时,对应的试验指标的数值与在以某种“规律”发生变化,但那很可能是由
于实验误差所致,将它作为客观规律是不可靠的。有了各列的显著性检验之后,最后应将
影响不显著的交互作用列与原来的“误差列”合并起来。组成新的“误差列”,重新检验各
列的显著性。
5.6 正交试验方法在化工原理实验中的应用举例
例 5-2 为提高真空吸滤装置的生产能力,请用正交试验方法确定恒压过滤的最佳操作
条件。其恒压过滤实验的方法、原始数据采集和过滤常数计算等见《过滤实验》部分。影
响实验的主要因素和水平见表 5-5(a)。表中Δp 为过滤压强差;T 为浆液温度;w 为浆液
52
质量分数;M 为过滤介质(材质属多孔陶瓷)。
解:(1)试验指标的确定:恒压过滤常数 K(m2/s)
(2)选正交表:根据表 5-5(a)的因素和水平,可选用 L 8(4×2
4)表。
(3)制定实验方案:按选定的正交表,应完成 8 次实验。实验方案见表 5-5(b)。
(4)实验结果:将所计算出的恒压过滤常数 K(m2/s)列于表 5-5(b)。
表 5-5(a) 过滤实验因素和水平
因素 压强差/kPa 温度/℃ 质量分数 过滤介质
符号 Δp T w M
水平
1
2
3
4
2.94
3.92
4.90
5.88
(室温)18
(室温+15)33
稀(约 5%)
浓(约 10%)
G2*
G3*
* G2 、G3为过滤漏斗的型号。过滤介质孔径:G2 为 30~50μm、G3为 16~30μm。
表 2-5(b)正交试验的试验方案和实验结果
列号 j=1 2 3 4 5 6
因素 Δp T w M e K(m2/s)
试验号 水 平
1
2
3
4
5
6
7
8
1
1
2
2
3
3
4
4
1
2
1
2
1
2
1
2
1
2
1
2
2
1
2
1
1
2
2
1
1
2
2
1
1
2
2
1
2
1
1
2
4.01×10-4
2.93×10-4
5.21×10-4
5.55×10-4
4.83×10-4
1.02×10-3
5.11×10-4
1.10×10-3
(5)指标 K 的极差分析和方差分析:
分析结果见表 5-5(c)。以第 2 列为例说明计算过程:
Ⅰ2 =4.01×10
-4+5.21×10-4+4.83×10-4+5.11×10-4=1.92×10-3
Ⅱ2 =2.93×10
-4+5.55×10-4+1.02×10-3+1.10×10-3=2.97×10-3
k2=4
Ⅰ2/ k2=1.92×10
-3/4=4.79×10-4
Ⅱ2/ k2=2.97×10
-3/4=7.42×10-4
D2=7.42×10
-4
- 4.79×10-4=2.63×10-4
ΣK=4.88×10-3 K 6.11×10-4
S2=k2(Ⅰ2/ k2- K )
2+k2(Ⅱ2/ k2- K )
2
=4(4.79×10-4-6.11×10-4 )2 +4(7.42×10-4-6.11×10-4 )2 =1.38×10-7
53
f2=第二列的水平数-1=2-1=1
V2=S2/f2=1.38×10
-7/1=1.38×10-7
Se=S5=k5(Ⅰ5/ k5- K )
2+k5(Ⅱ5/ k5- K )
2
=4(6.22×10-4-6.11×10-4 )2 +4(5.99×10-4-6.11×10-4 )2 =1.06×10-9
fe=f5=1
Ve=Se/fe=1.06×10
-9/1=1.06×10-9
F2 =V2/Ve=1.38×10
-7/1.06×10-9=130.2
查《F 分布数值表》可知:
F(а=0.01,f1=1,f2=1)=4052 > F2
F(а=0.05,f1=1,f2=1)=161.4 >F2
F(а=0.10,f1=1,f2=1)=39.9 < F2
F(а=0.25,f1=1,f2=1)=5.83 < F2
(其中:f1 为分子的自由度,f2 分母的自由度)
所以第二列对试验指标的影响在 =0.10 水平上显著。其他列的计算结果见表 2-5(c)。
表 5-5(c) K 的极差分析和方差分析
列号 j=1 2 3 4 5 6
因素 Δp T w M e K(m2/s)
项目
Ⅰj
Ⅱj
Ⅲj
Ⅳj
kj
Ⅰj/ kj
Ⅱj/ kj
Ⅲj/ kj
Ⅳj/ kj
Dj
Sj
fj
Vj
Fj
F0.01
F0.05
F0.10
F0.25
显著性
6.94×10-4
1.08×10-3
1.50×10-3
1.61×10-3
2
3.47×10-4
5.38×10-4
7.52×10-4
8.06×10-3
4.59×10-4
2.65×10-7
3
8.84×10-8
83.6
5403
215.7
53.6
8.20
2*(0.10)
1.92×10-3
2.97×10-3
4
4.79×10-4
7.42×10-4
2.63×10-4
1.38×10-7
1
1.38×10-7
130.2
4052
161.4
39.9
5.83
2*(0.10)
3.04×10-3
1.84×10-3
4
7.61×10-4
4.61×10-4
3.00×10-4
1.80×10-7
1
1.80×10-7
170.1
4052
161.4
39.9
5.83
3*(0.05)
2.54×10-3
2.35×10-3
4
6.35×10-4
5.86×10-4
4.85×10-5
4.70×10-9
1
4.70×10-9
4.44
4052
161.4
39.9
5.83
0*(0.25)
2.49×10-3
2.40×10-3
4
6.22×10-4
5.99×10-4
2.30×10-5
1.06×10-9
1.06×10-9
1.00
ΣK=
4.88×10-3
(m2/s)
K
6.11×10-4
(m2/s)
(6)由极差分析结果引出的结论:请同学们自己分析。
54
(7)由方差分析结果引出的结论。
① 第 1、2 列上的因素 Δp、T 在 =0.10 水平上显著;第 3 列上的因素 w 在 =0.05
水平上显著;第 4 列上的因素 M 在 =0.25 水平上仍不显著。
② 各因素、水平对 K 的影响变化趋势见图 5-3。图 5-3 是用表 5-5(a)的水平、因素
和表 5-5(c)的Ⅰj/ kj 、Ⅱj/ kj 、Ⅲj/ kj 、Ⅳj/ k 值来标绘的。从图中可看出:
A.过滤压强差增大,K 值增大;
B.过滤温度增大,K 值增大;
C.过滤浓度增大,K 值减小;
D.过滤介质由 1水平变为 2水平,多孔陶瓷微孔直径减小, K 值减小。因为第 4 列对
K 值的影响在 =0.25 水平上不显著,所以此变化趋势是不可信的。
③ 适宜操作条件的确定。由恒压过滤速率议程式可知,试验指标 K 值愈大愈好。为
此,本例的适宜操作条件是各水平下 K 的平均值最大时的条件:
过滤压强差为 4水平,5.88kPa
过滤温度为 2水平,33℃
过滤浆液浓度为 1水平,稀滤液
过滤介质为 1水平或 2水平(这是因为第 4列对 K 值的影响在 =0.25 水平上不显著。
为此可优先选择价格便宜或容易得到者)。
上述条件恰好是正交表中第 8 个试验号。
图 5-3 指标随因素的变化趋势