ТРУДЫ БГТУ. 2012. № 6. Физико-математические науки и информатика. С. 27-30 27
УДК 519.254
Е. И. Ловенецкая, кандидат физико-математических наук, доцент (БГТУ)
ОПТИМАЛЬНОСТЬ ПЛАНОВ ПОЛНОБЛОЧНЫХ РЕГРЕССИОННЫХ ЭКСПЕРИМЕНТОВ
В статье изучаются свойства оптимальности планов полноблочных экспериментов, которые могут использоваться для получения регрессионных моделей в случае двух независимых групп факторов. Полноблочный эксперимент можно рассматривать как композицию двух экспериментов, для каждой группы факторов отдельно. В статье исследуется связь между свойствами D-, A-, E-, G-оптимальности и ортогональности полноблочного эксперимента и этими свойствами составляющих его экспериментов.
The optimality properties of full-block experiments have been studied in the article. These experiments can be used for obtaining the regression equations in case of two independent groups of factors. The most important optimality properties of the experimental design are D-, A-, E-, G-optimality and orthogonality. The full-block experiment may be considered as the composition of two experiments, for each group of factors separately. The connection between the optimality properties of the full-block experiment and the same properties of its components has been investigated in the article.
Введение. Получение нелинейного уравнения регрессии по методу наименьших квадратов (МНК) в случае большого числа факторов может представлять значительные вычислительные трудности. В некоторых ситуациях выходной параметр зависит от нескольких групп факторов различной природы, причем результаты эксперимента представляют собой измерения выходного параметра при всех возможных комбинациях рассматриваемых значений факторов всех групп. Назовем такой эксперимент полноблочным. Например, в химической технологии при исследовании зависимости некоторого свойства смеси от состава и температуры результаты эксперимента представляют собой измерения данного свойства y для каждого состава при каждом значении температуры и могут быть записаны в виде матрицы, строки которой соответствуют различным составам, а столбцы - разным значениям температуры. В пособии [1] приведен пример обработки результатов такого эксперимента путем получения зависимости свойства от состава, а затем определения линейной зависимости коэффициентов от температуры. Аналогичная методика была применена в статье [2].
Если полагать для наглядности, что определяется линейная зависимость y от одного фактора состава x, то в результате будет получено регрессионное уравнение вида
y = (b0 + v) + (b + V) x,
которое может быть записано как
y = b0 + b1x + b01t + b11xt. (1)
В работе [3] показано, что уравнение типа (1) при различных видах зависимости от двух групп факторов может быть получено как путем последовательного применения МНК два-
жды, как это описано выше, так и непосредственным определением коэффициентов зависимости типа (1) по МНК.
Согласно МНК в матричной форме записи, коэффициенты уравнения регрессии рассчитываются по формуле
В = (Хт X) ~1ХТ¥,
где В - столбец определяемых коэффициентов; X - матрица базисных функций, строки которой соответствуют проводимым опытам, а столбцы -членам регрессионного уравнения; ¥ - столбец наблюдаемых значений параметра у.
Планирование эксперимента определяется выбором подходящей матрицы базисных функций X, в которой фактически заключена вся информация о виде уравнения регрессии, которое предполагается получить, и плане проводимого эксперимента. Будем называть эту матрицу также планом эксперимента, поскольку свойства плана эксперимента определяются также этой матрицей, а точнее, ковариационной матрицей
Сх = (ХТХ)-1.
Для сравнения качества планов в теории планирования эксперимента используются различные критерии оптимальности планов эксперимента. Наиболее часто применяются критерии Б-, А-, Е- и О-оптимальности, а также ортогональности и ротатабельности.
В данной работе рассмотрены условия, при которых планы полноблочных экспериментов обладают свойствами Б-, А-, Е-, О-оптималь-ности и ортогональности.
Основная часть. Полноблочный эксперимент можно рассматривать как композицию двух экспериментов. Пусть выходной параметр у наблюдается при N различных значениях факторов 1-й группы и N различных значениях
факторов 2-й группы. На первом этапе определяются регрессионные зависимости выходного параметра от факторов 1-й группы при фиксированных значениях факторов 2-й группы. Если эти зависимости содержат к1 членов, то матрица X базисных функций такого эксперимента (в котором варьируются только факторы 1-й группы) имеет размер N х к1. Пусть на втором этапе определяются регрессионные зависимости коэффициентов полученных моделей от факторов 2-й группы, содержащие к2 членов. Тогда матрица Z базисных функций эксперимента для факторов 2-й группы имеет размер N2 х к2.
В [3] показано, что матрица X базисных функций полноблочного эксперимента, представляющего собой композицию экспериментов с матрицами базисных функций X и Z, имеет вид
X = Z ® X =
z„ X
Z12 X
Z 21X Z22 X
2 1X
ZN22 X
Z1k2 X ^ Z2k2 X
ZN2k2 X
т. е. это блочная (клеточная) матрица размера N1 N х к1к2, каждый блок которой представляет собой матрицу Хщ хк^, умноженную на соответствующий элемент матрицы хк . Матрица X
называется прямым (кронекеровым) произведением матриц Z и X [4].
Из свойств кронекерова произведения матриц [4] следует, что ковариационная матрица блочного эксперимента также является кроне-керовым произведением ковариационных матриц экспериментов с матрицами базисных функций X и Z:
'X
= (XX)-1 = CZ ® C
X'
где CZ = (ZTZ)-1, CX = (XTX)-1. Отметим также, что для любой матрицы базисных функций X размера N х к, где N > к, ковариационная матрица CX = (XTX)-1 является симметрической и, при условии rang X = к, положительно определенной матрицей.
Дальнейшие свойства кронекерова произведения позволяют установить связь между оптимальными свойствами плана X = Z ® X полноблочного эксперимента и составляющих его планов X и Z при заданных размерах N1 х к1 и N2 х к2 матриц X и Z.
Ортогональность. Свойство ортогональности позволяет получить статистически независимые оценки коэффициентов регрессии и упрощает расчет этих оценок. План с матрицей базисных функций X* называется ортогональным, если столбцы матрицы X ортогональны.
При этом его ковариационная матрица является диагональной.
Утверждение 1. Полноблочный эксперимент обладает свойством ортогональности в том и только том случае, когда обладают свойством ортогональности составляющие его эксперименты.
Пусть полноблочный эксперимент удовлетворяет свойству ортогональности. Его ковариационная матрица является блочной матрицей вида
(
Cx= Cz ® Cx=
CiiC
X
с C
21 X
Ck21CX
C12 CX
C C
22 X
Ck22 C X
C1k2 CX
C 2 k2 C X
Ck2k2 CX
\
где Су - элементы матрицы CZ. Поскольку в силу свойства ортогональности матрица CX диагональная, то блоки вида ciiCX представляют собой диагональные матрицы, а блоки СуСх, где i Ф j, - нулевые матрицы. Учитывая, что ковариационная матрица Сх является ненулевой, заключаем, что ci}- = 0 при всех i Ф j и cii Ф 0 при всех i, а также что Сх является диагональной матрицей.
Аналогично, если матрицы Сх и CZ диагональные, то и CX = CZ ® Сх является диагональной матрицей.
D-оптимальность. Критерий D-оптималь-ности является одним из самых важных и часто применяемых. План с матрицей базисных функций X* называется D-оптимальным, если X * = arg min det C X. D-оптимальные планы
X
часто стремятся использовать на практике, поскольку D-оптимальный план минимизирует обобщенную дисперсию оценок коэффициентов уравнения регрессии (объем эллипсоида рассеяния оценок коэффициентов регрессии).
Утверждение 2. Полноблочный эксперимент обладает свойством D-оптимальности в том и только том случае, когда обладают свойством D-оптимальности составляющие его эксперименты.
Для матрицы базисных функций х размера N1 X k1 соответствующая ковариационная матрица Сх имеет размер k1 X k1, матрице Z размера N2 X k2 соответствует матрица CZ размера k2 X k2. Тогда [4]
det CX = (detCz )kl • (det Сх )k2.
Пусть план X* = Z* ® х* является D-опти-мальным в классе планов полноблочных экспериментов с заданными размерами N1 X k1 и N2 X k2 блоков х и Z соответственно, т. е.
Z
N
Оптимальность планов полноблочных регрессионных экспериментов
29
detC . < detC
х
X
для
всех
планов
X = ZN2xk2 ® XN1xkl- Следовательно,
((е! Сг. У • (((е! Сх. ^ < (е! С2 ) • (е! Сх )2 (2)
для любых планов Х^^ и ZN ук. Поскольку
матрицы Сх и С2 положительно определены, их определители (й Сх > 0, (й С2 > 0. Заменяя в правой части неравенства (2) величину
(й С2 )к на (й С^) 1, получим
(det C * У < (det CX )k
det C * < det CX
x X
для любых планов X^ , что означает, что план X является Б-оптимальным в классе планов XNхк^. Аналогично доказывается, что план Z * обладает свойством Б-оптимальности в классе планов хк
Обратно, если планы X * и 2 * являются Б-оптимальными в классе планов и ZN2 хксоответственно, т. е. (е!Сх* < (е!Сх для любых планов х^^ и (е! С . < (е! С2 для всех
хкг, то план X* = 2* ® х* удовлетворяет условию
аеС . =(((е! С . ^ •(аег С . Ь <
X V 2 / V х /
<(е! С2 ) •((е! Сх. <
< ( С2 ) • ( Сх )к2 = аег CX для любых
X = ZN2xk2 ® XNlxkl^
полноблочных планов т. е. является D-оптималь-ным в классе планов полноблочных экспериментов с заданными размерами N х kx и N2 х k2 блоков Xи Z соответственно.
A-оптимальность. План с матрицей базисных функций X* называется A-оптимальным, если X* = arg min tr CX, где tr CX - след (сумма диагональных элементов) матрицы CX. А-оптимальный план минимизирует среднюю дисперсию оценок коэффициентов уравнения регрессии.
Утверждение 3. Полноблочный эксперимент обладает свойством A-оптимальности в том и только том случае, когда обладают свойством A-оптимальности составляющие его эксперименты.
Из свойств кронекерова произведения [4] следует, что tr CX = trCz • trCX. Поскольку след любой невырожденной ковариационной матрицы trCX > 0, это соотношение позволяет дока-
зать утверждение 3 аналогично доказательству утверждения 2.
E-оптимальность. План с матрицей базисных функций X называется E-оптимальным,
если X* = argmin X max(Cx X где X max(CX ) -
наибольшее собственное значение матрицы Cх. E-оптимальные планы позволяют получить оценки коэффициентов регрессии, не обладающие слишком большими дисперсиями и ковариациями.
Утверждение 4. Полноблочный эксперимент обладает свойством E-оптимальности в том и только том случае, когда обладают свойством E-оптимальности составляющие его эксперименты.
Для доказательства этого утверждения используется тот факт [4], что собственными числами кронекерова произведения двух матриц являются произведения собственных чисел этих матриц. Поскольку для положительно определенных матриц все собственные значения строго положительны [4], то справедливо соотношение Xmax (CX ) =X max (CZ ) 'X max (CX X в
силу чего утверждение 4 доказывается аналогично предыдущим.
G-оптимальность. Свойство G-оптималь-ности представляется важным с точки зрения предсказательных свойств уравнения регрессии. План с матрицей базисных функций X* называется G-оптимальным в области планирования Q, если X* = arg min max 5
X XeQ
:{y(X)},
где
!{y(X)}
означает дисперсию оценки выход-
ного параметра у, рассчитанной при заданных
значениях факторов X.
В предположении однородности дисперсий наблюдений параметра у в области планирования
52 { У(X )} = 52 {у} XX TCxX,
где 52 {у} - дисперсия воспроизводимости параметра у; X - столбец заданных значений факторов. Для полноблочного эксперимента X = 2 ® х, где х и 2 - столбцы заданных значений факторов 1-й и 2-й групп соответственно. Следовательно, для эксперимента с матрицей базисных функций СX = С2 ® Сх получим
52 { уф }= 52 {у}(Т ® хТ )) ® Сх ® х ),
что в силу правила умножения кронекеровых произведений [4] дает
52 {У(X)} = 52 {у}() ® ((ТСх^х ) .
Поскольку ХтСхХ и 2Т С22 - числа, то для любого фиксированного полноблочного плана X = 2 ® X справедливо
~ тах (2тС22)®(Х~тСХХ)=
Хейь 2<=Й2Х
= maxX CXX • max Z CzZ,
XeQj ZeQ2
в силу чего аналогично предыдущим рассуждениям получаем условие О-оптимальности плана полноблочного эксперимента.
Утверждение 5. Полноблочный эксперимент обладает свойством О-оптимальности в том и только том случае, когда обладают свойством О-оптимальности составляющие его эксперименты.
Ротатабельность. Свойство ротатабель-ности плана эксперимента также является одним из наиболее востребованных на практике. План называется ротатабельным, если точность 52 {_р(Х)} предсказания значений выходного параметра одинакова во всех равноудаленных от центра планирования точках.
Однако, в отличие от рассмотренных выше свойств оптимальности планов, из ротатабель-ности планов X и 2 не следует ротатабельность полноблочного плана X = 2 ® X. Для подтверждения этого рассмотрим пример. Пусть X и 2 - простейшие двухточечные планы, позволяющие получить линейное уравнение с одним фактором. Матрицы базисных функций имеют вид
X = Z =
f1 - п 1 1
В этом случае полноблочный план X = 2 ® X представляет собой хорошо известный план полного факторного эксперимента (ПФЭ) типа 22, а матрица базисных функций X = 2 ® X соответствует модели с парным взаимодействием.
Нетрудно показать, что планы X и 2 обладают свойством ротатабельности, однако известно [1], что ПФЭ типа 2к удовлетворяет
критериям D-, A-, E- и G-оптимальности и является ротатабельным планом в случае построения линейной модели, но не обладает свойством ротатабельности для модели со взаимодействиями.
Заключение. В статье рассмотрены полноблочные эксперименты, в которых определяется зависимость выходного параметра от нескольких групп факторов различной природы, причем результаты эксперимента представляют собой измерения выходного параметра при всех возможных комбинациях рассматриваемых значений факторов всех групп. В этом случае может быть использована последовательная процедура определения коэффициентов регрессионной модели: на первом этапе определяются регрессионные зависимости выходного параметра от факторов 1-й группы при фиксированных значениях факторов 2-й группы, а затем - регрессионные зависимости коэффициентов полученных моделей от факторов 2-й группы.
Основное содержание статьи составляет исследование связи между свойствами D-, A-, E-, G-оптимальности и ортогональности плана полноблочного эксперимента и этими свойствами составляющих его планов эксперимента.
Литература
1. Ахназарова, С. Л. Методы оптимизации эксперимента в химической технологии: учеб. пособие / С. Л. Ахназарова, В. В. Кафаров. -М.: Высш. шк., 1985. - 327 с.
2. Расчет вязкости многокомпонентных бо-росиликатных стекол / И. А. Левицкий [и др.] // Труды БГТУ. Сер. III, Химия и технология неорган. в-в. - 2010. - Вып. XVIII. - С. 47-50.
3. Блинова, Е. И. Применение метода наименьших квадратов при обработке результатов полноблочного регрессионного эксперимента / Е. И. Блинова // Труды БГТУ. Сер. VI, Физ.-мат. науки и информатика. - 2010. - Вып. XVIII. -С. 31-34.
4. Ланкастер, П. Теория матриц / П. Ланкастер. - М.: Наука, 1978. - 280 с.
Поступила 15.03.2012