介绍正交超立方试验设计表 / Introduction to Orthogonal Hypercube Experimental Designs

in #ohc6 years ago

贺深泽 (Email:[email protected] )

1. 前 言

正交设计是 20 世纪应用数学的伟大创造,从此,科学实验与工业技术开发可以有计划地进行,减少了实验数目, 缩短了开发周期,降低了开发成本,提高了开发质量,大大推动了科学与技术的发展。

我们最熟悉的田口正交表具有均衡分散,齐整可比的特点。 通过均衡地安排试验点消除试验误差,不仅可以研究定量因子,也可以研究定性因子, 不仅可以估计出因子的效应,还可以估计出因子的水平的效应。

上述特点表明,这类正交表是拉丁的,即向量的水平代表的是符号。所以,这类正交表又可以称为拉丁正交表,不定义数值特征。

这种齐整正交设计也有一些弱点。最主要的弱点有三个:
  • 试验数与水平数的幂成正比,随因子的水平数增加试验数迅速地增加。
  • 试验点密度低。
  • 大部分齐整正交表的因子的效应估计有混杂叠加现象。

在某些条件下,上述正交设计的齐整性条件过强。保持其均衡分散的特点,放弃其齐整可比的要求。 这是改进正交设计的上述弱点的主要思想。 例如,所有回归设计都不要求其实验设计是齐整的,但要求是均衡的; 梯度法的梯度向量的数值估计其设计不要求实验设计方案是齐整的,为避免数值微分,最好不包含非线性项; 当具备预报函数之后,估计最优化点,其搜索网点的分布不要求是齐整的,但要求均衡性和稠密性。

下面介绍一种解决方案。

2. 正交超立方

2.1 变量的数字特征

试验设计中,一个向量代表一个变量,向量的分量代表该变量的水平。 变量可以是定量的,它的水平是数值的。变量也可以是定性的,它的一个水平只是一个符号。 例如,原料的品种,产地,但原料的纯度是数值。 只有定量的变量才有数值特征。 所以,齐整的或拉丁的正交设计不定义数值特征(参考 Hedayat 1999)。 显然,拉丁正交表可以用于研究数值变量,那时便有数值特征。

一个向量 x=(x1,...,xn)T, 如果是数量的,即,xi是数值, 那么,该变量有数值特征,多少,大小等等。下面这些数值特征在实验分析过程中是非常重要的统计量:

均值
x-=(x1+...+xn)/n, ------ (1)
(注:习惯上,均值由变量上方加“-”来表示,但某些语言不支持这一符号,故把 “_" 移至右上角,下同。)

内积
xiTxj=x1ix1j+...+xnixnj------ (2)

差乘和
spdij=(x1i-x-i)(x1j-x-j)+...+ (xni-x-i)(xnj-x-j)=xiTxj- nx-ix-j ------ (3)

方差估计
σ2i=[(x1i-x-)2+...+(xni-x-i)2]/(n-1) =[xiTxi-nx-i2 ]/(n-1)=spdii/(n-1) ------ (4)

协方差估计
cov(xi,xj)=[(x1i-x-i)(x1j-x-j) +...+(xni-x-i)(xnj-x-j)]/(n-1) =spdij/(n-1)------ (5)

相关系数
corr(xi,xj)= rij =cov(xi,xj)/(σiσj) (i,j=1,2,…,m; i≠j) =spdij/√(spdiispdjj)------ (6)

设一个向量为 x=(x1,...,xn )T, 则任何一个n×m 矩阵 X=(x1,x2,...,xm) 是实欧氏空间 IRn 中的超立方体。 以这样的矩阵作 m 个输出变量的采样方案,它就是超立方设计。 如果每个 x 的取值范围被随机地划分,该设计是随机设计。 如果每个 x 的取值空间被等距离地划分,它是一种边际分布均匀的特定的划分, 我们以后都默认超立方设计是边际分布均匀的。

2.2 正交超立方及正交性表征

我们现在给这种分划一个严谨的描述。

设每个向量 xi (i=1,2,...,m) 的变化区间的水平等距离分划为 Li=(l1i,...,lni)T, 其中 lki,(k=1,2,...,n) 都是实数, 且 lki<l(k+1)i,k=1,2,...,n-1,相邻两水平之间的间距为 Δ= l(k+1)i-lki 是一个常数,则称Li 为因子xi 的水平设计, 它的全体置换的集合记作Si, 有时也称 Li 为Si 的母向量。 若 X 的向量 xi=(x1i,…,xni)TLi 的一个置换, 则称 X 是一个超立方设计 记作 HC。 如果 l1i=1, Δ=1, 则称 X 为标准超立方

如果 X 的所有向量满足条件
rij=0 或 cov(xi,xij)=0, 或 spdij=0 ------(7)
则称 X 为零相关超立方设计,简称为零相关设计

欧氏空间中的任何矩阵都对应一个相关矩阵 R=(rij) ,它 是一个对称矩阵,其对角线元素 为 1. 在对角线之外的元素的绝对值必有一个最大的相关系数,记作mcc
mcc=max{|rij| , i≠j; i,j=1,2,…,m}

如果所有向量xi 满足条件
xiTxj=0, (i≠j; i,j=1,2,...,m) ------(7)
则称 X 为正交超立方设计,记作 OHC。正交超立方设计的 mcc=0.

零相关的不一定是正交的。如果所有向量的均值为 0,则正交的超立方设计一定是零相关的。 零相关设计由下列变换令 a=x- 正交化,
x=x-a
再用下列变换令 b=1/Δ 可以使 X 标准化。
x=bx

如果 X 的 mcc 非常小,则该设计的相关性非常弱。此时,可以认为 X 是弱相关的。 一个设计的相关性的强与弱是相对的,单用相关系数的大小不能作出判别。同一个小的相关系数值, 例如 mcc=0.1 在小的运行数可能相关性足够弱,在更大的运行数则可能不够弱。 这与自由度有关。相关性是否足够弱,依赖于相关系数临界值,它是置信水平 α 与 自由度 (n-1) 的函数。相关系数临界值随自由度的变大而变小。 如果 mcc 大于相关系数临界值r α(n-2),则该设计至少有两个列向量相关性的置信水平小于 α, 即,该两个变量的相关性的置信概率大于 p=1- α, 此时称该设计的相关性置信水平小于 α 或相关性置信概率大于 p=1- α。 置信水平 α 与置信概率 p=1- α 是两个标准的统计判别量,应该作为设计的相关性的控制量,或判别准则。 这个值 α 取多大?依赖于具体工程的要求。

置信水平 α 与 相关系数负相关,而 P 值与相关系数正相关。所以一般使用 P 值作判别量,比较方便,更符合习惯。

按代数学观点,在欧氏空间中,给定第一个向量 X1是任何实向量, 可以依次计算出 X2X3,..., 构成一个正交矩阵。但是,当若要求 X 的各列的水平满足水平等距离分划的条件,正交阵列不一定能够被构造出来。

正交超立方存在的条件是:

定理:零相关矩阵存在的必要条件是 n 为大于 3 的奇数或 4 的倍数。当 n=4k+2(k为正整数)时不存在零相关矩阵。

一个正交超立方如果存在,是多解的。

2.3 正交拉丁超立方

McKay, Beckman, 和~Conover (1979) 将每个变量 xk 的范围按概率均匀地划分为 n 层, 每层采样一次,并称之为拉丁超立方采样(LHS)。

Ye(1998),Steinberg 和 Lin(2006) 让 LH 的每个xk 包含 n 个等间距的水平。 在采样空间引入距离属性,事实上给向量赋予了数值特征。 这是对随机设计的改进。使随机设计的边际分布均匀化。这就在事实上在形式上赋予了 LHS 设计数值特征, 因而与欧氏空间的超立方无异。 这样,在形式上,正交超立方与正交拉丁超立方在欧氏空间中得到统一。

超立方设计当然可以应用于定性因子,只需把代表水平的数值换成相应的符号即可。 由于点分布均衡分散,通过直接比较,可以实现因子优选。 如何处理 数据得到预报方程? 期待应用结果。

2.4 正交超立方与齐整正交设计的差异

超立方的边际分布是均匀的,即每个变量的水平设计都是均匀的, 但其联合分布不一定是均匀的,甚至可能是非常不均匀的。 正交超立方设计可以是不齐整不规则的但必须是充分分散的。 满足正交的条件的阵列试验点分布可以是非常不均匀的,试验点甚至可能分布在一两条直线上, 这样的非常不均匀的正交阵列不应该列入正交设计的集合之中。 当使用随机构造方法构造正交超立方设计,由于随机性,点分布十分不均匀的概率很小。 9运行正交超立方w9h5o 的全部二维点阵图表明了这种情况。 如果对点分布均衡性要求很高,需要逐一检查点的分布状况。单从相关矩阵难以作出判断。 如果采用合成构造法,例如张量积,产生极端不均匀分布的概率非常高。 对这类问题,我们另文专门讨论。

以田口正交表为例,当把这些正交表中代表拉丁符号的数字就当作是数字,用于定量变量的实验设计, 其相关矩阵是单位矩阵。这就意味着,它们是零相关的。在 Hedayat (1999)书中提到的正交阵列,OA(N,k,s,t), 除了OAI 和 OAII 两种类型外,也都是零相关的,因而中心化后是正交的。 不过,都不属于超立方类型, Hedayat 称之为固定水平或混合水平类型。

2.3 正交超立方例

笔者已经在笔记本电脑上用直接法构造出运行数范围在 4 至 37 之间的超立方阵列。凡是(运行数) n≠4k+2 的阵列都包含零相关正交子阵。 n > 21 的阵列是目前文献上不能找到的。我的命名方法参考:

命名约定

三个正交超立方例(点击可浏览):

w19h7o

w21h7o

w28h7o

参考

  1. 田口玄一,《正交计划法》,丸善株式会社,东京, (1976).
  2. G.Taguchi, intdoduction to Quality Engineeering: Designing Quality into products and processes. Tokyo: Asian Productivity Organization, (1986)
  3. A.S.Hedayat, N.J.A.Sloane & John Stufken, Orthogonal Arrays: Theory and Applications,Springer,(1999).
  4. 贺深泽, 弱相关试验设计, 数学的实践与认识, 2009, 39 卷第 3 期
  5. McKay,M.D.,Beckman,R.J. & Conover,W.J. A comparison of three methods for selecting values of input variables in the analysis of output from a computer code. Technometrics, vol. 21, 239-245, (1979).
  6. Ye.K.Q, On the Orthogonal column Latin hypercubes and~their application in computer experiments, J.Am.Statist.Assoc. 93,1430-1439, (1998).
  7. Steinberge,D.M, Lin,D.K.J, A construction method for orthogonal Latin hypercube designs. Biometrika,93, 2,279-288, (2006).
Sort:  

Congratulations @shenzehe! You have completed the following achievement on Steemit and have been rewarded with new badge(s) :

Award for the number of posts published

Click on the badge to view your Board of Honor.
If you no longer want to receive notifications, reply to this comment with the word STOP

To support your work, I also upvoted your post!

Do not miss the last post from @steemitboard:
SteemitBoard World Cup Contest - The results, the winners and the prizes

Do you like SteemitBoard's project? Then Vote for its witness and get one more award!

Coin Marketplace

STEEM 0.18
TRX 0.14
JST 0.030
BTC 59634.42
ETH 3191.92
USDT 1.00
SBD 2.45