Научная статья на тему 'Топологические и структурные свойства многофакторных планов экспериментов'

Топологические и структурные свойства многофакторных планов экспериментов Текст научной статьи по специальности «Математика»

CC BY
199
40
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ПЛАНИРОВАНИЕ ЭКСПЕРИМЕНТА / РЕГРЕССИОННЫЙ АНАЛИЗ / ТОПОЛОГИЧЕСКОЕ ОТОБРАЖЕНИЕ / СТРУКТУРА ПЛАНА ЭКСПЕРИМЕНТА / DESIGN OF EXPERIMENT / REGRESSION ANALYSIS / TOPOLOGICAL MAPPING / DESIGN OF EXPERIMENT STRUCTURE

Аннотация научной статьи по математике, автор научной работы — Радченко С. Г.

Проанализированы свойства многофакторных планов экспериментов при топологическом отображении хорошо обусловленного факторного пространства – прообраза – в плохо обусловленное пространство – образ. С использованием введенного понятия структуры плана эксперимента показано сохранение информационных свойств плана прообраза и в образе.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

The properties of multifactorial designs of experiments under topological mapping of well-conditioned factor space – pre-image – into poor-conditioned factor space – image were analyzed. The maintenance of informative properties of experiment for pre-image and image was illustrated with the usage of introduced concept of design of experiment structure.

Текст научной работы на тему «Топологические и структурные свойства многофакторных планов экспериментов»

УДК 519.233.5:519.242.5 С.Г. РАДЧЕНКО*

ТОПОЛОГИЧЕСКИЕ И СТРУКТУРНЫЕ СВОЙСТВА МНОГОФАКТОРНЫХ ПЛАНОВ ЭКСПЕРИМЕНТОВ

*

Национальный технический университет Украины "Киевский политехнический институт", Киев, Украина

Анотація. Проаналізовано властивості багатофакторних планів експериментів при топологічному відображенні добре обумовленого факторного простору - прообразу - в погано обумовлений простір - образ. З використанням введеного поняття структури плану експерименту показано збереження інформаційних властивостей плану прообразу і в образі.

Ключові слова: планування експерименту, регресійний аналіз, топологічне відображення, структура плану експерименту.

Аннотация. Проанализированы свойства многофакторных планов экспериментов при топологическом отображении хорошо обусловленного факторного пространства - прообраза - в плохо обусловленное пространство - образ. С использованием введенного понятия структуры плана эксперимента показано сохранение информационных свойств плана прообраза и в образе. Ключевые слова: планирование эксперимента, регрессионный анализ, топологическое отображение, структура плана эксперимента.

Abstract. The properties of multifactorial designs of experiments under topological mapping of well-conditioned factor space - pre-image - into poor-conditioned factor space - image were analyzed. The maintenance of informative properties of experiment for pre-image and image was illustrated with the usage of introduced concept of design of experiment structure.

Keywords: design of experiment, regression analysis, topological mapping, design of experiment structure.

1. Введение

Постановка проблемы

Статистические регрессионные модели широко используются при моделировании различных сложных систем. Качество моделей определяется выбранным планом экспериментов, системой формирования структуры модели, устойчивостью оцениваемых коэффициентов, формой факторного пространства, числом возможных экспериментов и др. условиями. Для получения моделей с хорошими свойствами необходимо использовать системное оптимальное планирование регрессионного эксперимента [1, с. 71-75].

По мнению многих специалистов, одной из основных проблем множественного регрессионного анализа является мультиколлинеарность (взаимная сопряженность) эффектов - главных и взаимодействий [2, с. 186, 108-114]. Не допустить мультиколлинеарность эффектов можно, если использовать планирование экспериментов и получать планы, в которых эффекты ортогональны друг к другу или близки к ортогональным. К таким планам экспериментов относятся полные факторные эксперименты, многофакторные регулярные планы и планы на основе ЛПТ равномерно распределенных последовательностей [3].

При использовании планов экспериментов предполагается, что форма факторного пространства соответствует прямоугольному параллелепипеду (кубу), сфере или симплексу. В реальных прикладных задачах форма факторного пространства может не соответствовать вышеприведенным, так как между параметрами технических и технологических систем наблюдаются связи, которые близки к линейным, т.е. некоторые факторы Xi и Х}.

коррелированы между собой [3, с. 134]. Коррелированность факторов приводит к решению некорректно поставленных задач, что весьма усложняет получение статистических моде-

© Радченко С.Г., 2013

ISSN 1028-9763. Математичні машини і системи, 2013, № 2

лей с необходимыми хорошими критериями: ортогональность эффектов, адекватность, информативность и т.п. Соответствие плана эксперимента критериям П-, А-, Е-, G-оптимальности и другим позволяет получить хорошие модели.

Другой причиной, приводящей к возникновению мультиколлинеарности, является обработка результатов неспланированных («пассивных») экспериментов или результатов наблюдений. Этот случай наиболее сложный для получения хороших моделей.

Цель статьи

Изложение новых возможных подходов планирования эксперимента для получения регрессионных моделей в нестандартных областях факторного пространства и условий эксперимента, в которых факторы коррелированы.

2. Изложение разработанных методов

В традиционной практике планирования экспериментов используется ортогональная декартова система координат. Возможности ортогонального представления эффектов можно существенно расширить, если использовать такие системы координат, в которых эффекты модели будут представлены ортогонально, а не коррелированно.

Рассмотрим два условия задания экспериментов (рис. 1, табл. 1). В первом варианте

(рис. 1а) факторы

Г1] (-^/'пр , Х ¡Щ) ) = 0 . Во

Хі пр,

Х - пр ортогональны и коэффициент парной корреляции

(рис. 1б) коррелированы,

втором - факторы Х/0, X¡0

г/,

(Х/0, Х ¡0 )= 0,4472 . Факторное пространство прообраза ^пр ограничено прямоугольни-

ком, а образа Я0 - параллелограммом.

X-

/пр

X

¡пр

'пр

пр

пр

н-

8 9

°пп ^пр

пр

пр

5

чпр

'пр

7 Х/п

а б

Рис. 1. Различные топологически подобные области факторного пространства: а - область прообраза; б - область образа

Обратим внимание на то, что сочетание уровней факторов X/, X-, заданное в виде

четырехугольной координатной сетки значений, в определенном смысле является одним и тем же: при образовании собственной системы координат Х/(.), х-(.) в обоих экспериментах каждый уровень каждого фактора сочетается с каждым уровнем другого фактора. Координатная сетка со значениями уровней факторов хіпр, х-^ - область прообраза для

прямоугольника - топологически подобна координатной сетке значений уровней факторов х/0, х /0 - области образа для параллелограмма.

8

6

5

0

2

0

Математическая модель, полученная по данным, представленным на прямоугольнике, будет соответствовать наилучшим возможным критериям качества. Модель, полученная по данным, представленным на параллелограмме, по мере увеличения коррелиро-ванности факторов Хг0, X^ будет характеризоваться всё более худшими критериями ка-

чества, так как факторное пространство в координатах Х/0, Xу0 будет плохо обусловлено (рис. 1б).

Таблица 1. Матрицы планов экспериментов в областях прообраза и образа

Номер точки Значения уровней варьирования факторов в области прообраза Номер точки Значения уровней варьирования факторов в области образа

X ^/'пр у І пр Х/о ХІ0

1пр 3 2 1о 3 2

2 ■^пр 5 2 2о 5 2

3 пр 7 2 3о 7 2

4пр 3 5 4о 4 5

5пр 5 5 5о 6 5

6пр 7 5 6о 8 5

7пр 3 8 7о 5 8

8пр 5 8 8о 7 8

9пр 7 8 9о 9 8

Для получения универсального метода устойчивого оценивания коэффициентов многофакторных моделей необходимо найти метод перехода от заданного плохо обусловленного факторного пространства образа Я0 к наилучше обусловленному факторному пространству прообраза , в котором и необходимо решать поставленную задачу.

Таким методом является метод топологического отображения хорошо обусловленного факторного пространства прообраза ^пр, в котором эксперимент можно планировать

с наилучшими критериями, в плохо обусловленное факторное пространство образа Е<0, в котором планировать эксперимент традиционными методами невозможно. Отображение ^пр в ^0 при линейных ограничениях образа проводится по алгоритмам ЯЛ8ТЛ4,

ЯЛ8ТЛ5.1 [3, с. 156-171]. Системы и ^0 с заданными в них отношениями будут изоморфными, т. е. равными по виду, форме. Понятие изоморфизм включает в себя как частный случай понятие гомеоморфизма, играющее основную роль в топологии.

Г омеоморфизм - взаимно однозначное и взаимно непрерывное соответствие между двумя топологическими пространствами. Гомеоморфные пространства топологически эквивалентны.

На рис. 2 показаны топологически эквивалентные формы факторного пространства с линейными и криволинейными ограничениями. Фигуры а, б, в представляют систему Я0

образа, а фигура г представляет систему ^др прообраза.

Каждому объекту Хгпр (фактор), Хгмпр (точка) из системы ^др однозначно соответствует объект Х^ 0 (фактор), Х^и0 (точка) из системы ^0, и наоборот. Каждому отношению в системе ^пр однозначно соответствует отношение в системе Е0, и наоборот. Если некоторые объекты (Х1пр, Х2пр,..., Х£^) связаны в системе ^пр отношением

З^пр = (Х1пр, Х2пр, ..., Хкпр ^ то соответствующие объекты (Хlo, Х2o, ..., Хк0) в

системе Я0 должны быть связаны отношением у^о = ^0 (Х10,Х20, ..., Х£0), и наоборот.

Рассмотрим отношения для фигуры прообраза Фпр и фигуры образа Фо, приведенных на рис. 3. План эксперимента соответствует 22//4. Коррелированность факторов Х10, Х20 составляет (Х10, Х20) = -0,918. В табл. 2 приведены рабочие матрицы и пла-

ны экспериментов областей образа и прообраза факторного пространства, изображенных на рис. 3. Кодированные значения х^, Х2пр и Х10, Х20 есть ортогональные контрасты

факторов Х1пр, Х2пр и Х10, Х20 [3, с. 54-57, 162].

Функции отображения прообраза в образ Ф^ ® Фо (преобразование П), т. е.

Х1пр, Х2пр ® Х10 ; Х1пр, Х2пр ® Х20 , имеют вид

Х10 = 30 + 5х1пр — 20х2пр — 5х1пр х2пр,

Х20 = 20 + 2,5х1пр +15х2пр + 2,5х1пр х2пр, где х1пр = 0,2(Х1пр — 30), х2пр = 0,0666667(х 2пр — 20).

б

Рис. 2. Топологически эквивалентные формы факторного пространства с линейными и криволинейными ограничениями

х,г

X-

2пр

1пр о 2пр 1о

(-!;-!) (1; -1) (-!;-!)

г^Хю, Х2о) = -0,918

Фпр Гі,(Хіо, Х2о) = 0

^о.^пр

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Рис. 3. Области образа и прообраза факторного пространства при линейных ограничениях образа

Таблица 2. Рабочие матрицы и планы экспериментов областей образа и прообраза факторного пространства для линейного ограничения

Область прообраза Область образа

Номер точки в натуральных значениях факторов в кодированных значениях факторов Номер точки в натуральных значениях факторов в кодированных значениях факторов

Х 1пр Х 2пр х1пр х2пр *1о X 2о х1о х2о

1 пр 25 5 -1 -1 1о 40 5 -1 -1

2 пр 35 5 1 -1 2о 60 5 1 -1

3 пр 25 35 -1 1 3о 10 30 -1 1

4 ^ пр 35 35 1 1 4о 10 40 1 1

5 пр 30 20 0 0 5о 30 20 0 0

Функции для отображения образа, кодированного в прообраз Фо код ® Фпр (преобразование П-1), т.е. х^0, Х20 ® Х1пр; х^0, Х20 ® X2пр, имеют вид:

х1пр _30+5 х1о, х2пр =20+15 Х2о ,

где х1о = х1о;

Х2о = х2о .

В кодированных значениях факторов Х1о, X 2о и Х1пр, X 2пр, т.е. в ортогональных

контрастах Х(-)пр, Х(-)о, планы экспериментов эквивалентны.

Покажем, что информационные свойства многофакторных уравнений регрессии при отображении прообраза в образ сохраняются.

Основными классами используемых планов экспериментов являются многофакторные регулярные планы [4] и планы на основе ЛПТ равномерно распределенных последовательностей [5].

На основе понятия «структура математическая» введем понятие «структура плана эксперимента».

Структура математическая - задание дополнительных условий (операций, отношений, топологии и т. д.) на множестве, природа элементов которого не определена.

Структура плана эксперимента - отношение между уровнями варьирования факторов, подчиняющееся определенным условиям и/или зависимостям.

В качестве дополнительных условий в структуре плана эксперимента будем рассматривать отношение между уровнями варьирования факторов. Отношение - произвольное подмножество ^эк множества N всех кортежей - упорядоченных наборов вида si -уровней варьирования факторов, 1 < г < к ; к - число факторов. ^эк есть к -местное отношение на N. Понятие «отношение» в математике служит для выражения на теоретикомножественном языке связей между объектами.

Отношение в структуре плана эксперимента - подмножество ^эк множества N

всех кортежей - упорядоченных к -местных наборов (¿т, d2mi,..., ¿т,..., ¿т )е N, где - уровень варьирования г -го фактора тг -го уровня, т. е. т -й уровень г -го фактора, 1 < г < к , 1 < тг < , к - число факторов, ^ - число уровней г -го фактора, N число опытов

в плане эксперимента.

В каталогах планов экспериментов уровни варьирования факторов ¿т для многофакторных регулярных планов принято обозначать как 0, 1, 2, ..., si -1, а для планов на основе ЛПТ равномерно распределенных последовательностей - цифрами 0,5; 0,25; 0,75; 0,125;

0,625; 0,375; 0,875; ... на интервале (0; 1).

Структура регулярного плана эксперимента - отношение между уровнями варьирования факторов, подчиняющееся условию пропорциональности частот для факторов:

пр^7Г = пР .. п1 /N-1, где пр - число появлений р -го уровня г -го фактора, п^ - число

появлений q -го уровня у -го фактора и пI - число появлений г -го уровня 1-го фактора, где р = 0,1,..., si -1, q = 0,1,..., sj -1, г = 0,1,..., sl -1, г, у, I = 1,2,..., к, г Ф ] ФI, N - число

pq г

опытов в плане эксперимента, t - мощность плана эксперимента, 2 < t < к, п^- у - число

одновременных появлений в плане эксперимента указанных уровней для t факторов.

Структура ЛПТ плана эксперимента - отношение между уровнями варьирования

факторов, подчиняющееся условию содержания не менее чем 21+1 точек, представляющих собой ПТ -сетку, в любом двоичном участке ЛПТ последовательности. Число уровней каждого фактора si равно числу опытов N в плане эксперимента, т.е. si = N. Понятие полного факторного эксперимента для ЛПТ планов отсутствует.

С использованием понятия «структура плана эксперимента» рассмотрим сохранение информационных свойств многофакторных уравнений регрессии при отображении прообраза в образ [6].

Утверждение. При отображении многофакторного плана эксперимента из прообраза в образ структура плана и его статистические (информационные) свойства сохраняются.

Доказательство. Пусть отображение точек декартовой системы координат из прообраза в образ взаимно однозначно и взаимно непрерывно; функции отображения прямые

/іотоб и обратные Уіо'^об дифференцируемые (гладкие); якобиан I при обратном отображении в области прообраза не равен нулю. Точки плана эксперимента в прообразе принадлежат декартовой системе координат. Тогда структура плана эксперимента в образе соответствует структуре плана эксперимента в прообразе, так как собственные кодированные системы координат прообраза и образа топологически эквивалентны. План эксперимента в виде точек, координаты которых в собственной кодированной системе координат в прообразе есть уровни варьирования факторов, образует сетку уровней варьирования факторов, которая при отображении топологически эквивалентна сетке уровней варьирования факторов в образе. Такие свойства при переходе к гомеоморфным фигурам будут топологическими.

Статистические (информационные) свойства плана эксперимента (критерии П-, А-, Е-, G-, ^-оптимальности, ортогональности) полностью определяются его структурой и,

Т -1 2

выраженные как характеристики матрицы дисперсий-ковариаций (X X) а (е) в образе, будут соответствовать характеристикам плана эксперимента в прообразе, так как матрицы планов экспериментов в прообразе и образе будут эквивалентны друг другу в собственных кодированных системах координат.

Если статистические характеристики плана эксперимента (совокупность критериев качества плана) в прообразе «хорошие», то в образе они будут также «хорошие» в собственных кодированных системах координат. □

Статистическое моделирование с использованием отображения прообраза факторного пространства в образ факторного пространства предполагает, что полученные с применением метода наибольшего правдоподобия (метода максимального правдоподобия) оптимальные оценки в одном пространстве будут характеризоваться такими же свойствами и для другого пространства. Единственным оценкам коэффициентов регрессии, полученным в одном пространстве, должны соответствовать единственные оценки в другом пространстве.

При выполнении приведенных условий получение статистических моделей будет корректным: решение существует, оно единственно и устойчиво.

С разработанными методами решения регрессионных задач и полученными результатами можно ознакомиться в [7, 8].

3. Выводы и перспективы дальнейших исследований

1. При соответствии нестандартных областей факторного пространства (образ факторного пространства) требованиям выпуклости, связности и компактности для них методом топологического отображения можно найти хорошо обусловленные факторные пространства -прообраз факторного пространства, в которых и следует решать поставленные задачи.

2. Прообраз и образ факторного пространства топологически эквивалентны (гомеоморф-ны), т.е. в математическом понимании одинаковы как топологические пространства. В метрическом понимании указанные пространства отличаются своими статистическими свойствами в натуральных значениях координат по критериям коррелированности факторов между собой.

3. Устойчивое оценивание коэффициентов многофакторных моделей (1 < еоиё (ХТХ)< 10) достигается не использованием метода регуляризации или изменением заданных начальных условий, а путем решения задачи в наилучших из возможных условий, найденных путем топологического отображения реальных условий или использования других подходов.

4. Хорошие свойства статистических оценок коэффициентов уравнения регрессии, полученных в прообразе с использованием метода максимального правдоподобия, сохраняются и для условий, полученных путем топологического отображения прообраза в образ; единственность оценок также выполняется.

Дальнейшие исследования планов экспериментов для регрессионных моделей целесообразно проводить в разработке концепции ортогональности для условий неспланиро-ванного «пассивного» эксперимента и нестандартных областей факторного пространства.

СПИСОК ЛИТЕРАТУРЫ

1. Радченко С.Г. Системное оптимальное планирование регрессионного эксперимента / С.Г. Радченко // Заводская лаборатория. Диагностика материалов. - 2012. - Т. 78, № 7. - С. 71 - 75.

2. Демиденко Е.З. Линейная и нелинейная регрессии / Демиденко Е.З. - М.: Финансы и статистика, 1981. - 302 с.

3. Радченко С.Г. Методология регрессионного анализа / Радченко С.Г. - К.: Корнійчук, 2011. -376 с.

4. Бродский В.З. Введение в факторное планирование эксперимента / Бродский В.З. - М.: Наука, 1976. - 224 с.

5. Соболь И.М. Выбор оптимальных параметров в задачах со многими критериями: учеб. пособие для вузов / И.М. Соболь, Р.Б. Статников. - [2-е изд., перераб. и доп.]. - М.: Дрофа, 2006. - 175 с.

6. Радченко С.Г. Сохранение информационных свойств многофакторных планов экспериментов при отображении прообраза в образ / Радченко С.Г. // Тринадцята міжнарод. наук. конф. ім. академіка М. Кравчука: матер. конф. в т. 3, (Київ, 13-15 травня 2010 р.). - Київ: НТУУ «КПІ», 2010. -С. 97.

7. Лаборатория экспериментально-статистических методов исследований (ЛЭСМИ) [Электронный ресурс]. - Режим доступа: http://www.n-t.org/sp/lesmi.

8. Сайт кафедры «Технология машиностроения» Механико-машиностроительного института Национального технического университета Украины «Киевский политехнический институт» [Электронный ресурс]. - Режим доступа: http://tm-mmi.kpi.Ua/index.php/ru/1/publications.

Стаття надійшла до _редакц/г 08.11.2012

i Надоели баннеры? Вы всегда можете отключить рекламу.