УДК 621.9:001.8 С.Г. РАДЧЕНКО
ФОРМАЛИЗАЦИЯ ПОСТАНОВКИ МНОГОФАКТОРНОГО ЭКСПЕРИМЕНТАЛЬНОГО ИССЛЕДОВАНИЯ
Анотація. Розглянуто постановку експериментального дослідження із загальносистемних позицій. Уперше сформульовані вимоги до стійких (робастних) планів експериментів, стійких структур багатофакторних статистичних моделей і стійкості коефіцієнтів моделей. Наведено приклади успішного використання розробленого методу коректного рішення багатофакторних регре-сійних задач.
Ключові слова: експериментальний метод дослідження, стійкий (робастний) план експерименту, стійкі структура й коефіцієнти моделей, коректне рішення регресійних задач.
Аннотация. Рассмотрена постановка экспериментального исследования с общесистемных позиций. Впервые сформулированы требования к устойчивым (робастным) планам экспериментов, устойчивым структурам многофакторных статистических моделей и устойчивости коэффициентов моделей. Приведены примеры успешного использования разработанного метода корректного решения многофакторных регрессионных задач.
Ключевые слова: экспериментальный метод исследования, устойчивый (робастный) план эксперимента, устойчивые структура и коэффициенты моделей, корректное решение регрессионных задач.
Abstract. The paper deals with making the experimental general investigation from the general-system positions. The requirements to stable (robust) experiment designs, stable structures of multifactor statistical models and stability of models coefficients, have been formulated for the first time. Examples of successful use of the developed methods of correct solution of multifactor regression problems are presented. Key words: experimental method of investigation, stable (robust) experiment design, stable structure and model coefficients, correct solution of regression problems.
1. Введение. Постановка проблемы
Основными подходами к получению научно обоснованной информации являются теоретико-аналитический и экспериментально-статистический. Эксперимент используется в тех случаях, когда необходимо подтвердить полученные теоретические выводы или сформулированные гипотезы. Новизна исследуемых систем, процессов, объектов и их сложность могут быть такими, что использование теоретико-аналитического подхода затруднительно, неэффективно или невозможно [1, с. 87]. Тогда единственным средством познать реальную действительность будет проведение экспериментального исследования. Оно всегда связано с использованием исследовательской установки (стенда), объекта исследования (образцов), инструментов, измерительной и регистрирующей аппаратуры и других подсистем. Экспериментальный комплекс следует рассматривать как сложную систему, а в экспериментальном методе исследования определяющими свойствами являются системные статистические свойства [1, с. 83-84].
Результаты эксперимента являются следствием суммарного влияния групп управляемых, неуправляемых и неконтролируемых факторов [2, с. 20-21]. Число управляемых факторов может достигать 12...20 и более. Число неуправляемых и неконтролируемых факторов сравнительно велико и исследователю, как правило, не известно. По полученным экспериментальным результатам необходимо количественно восстановить степень воздействия каждого из управляемых факторов и оценить влияние групп неуправляемых и неконтролируемых факторов на исследуемые критерии качества.
© Радченко С.Г., 2011
ISSN 1028-9763. Математичні машини і системи, 2011, № 1
Экспериментальные результаты должны быть обработаны с использованием методов теории вероятностей, математической и прикладной статистики, теории планирования эксперимента, системного подхода.
Экспериментальный комплекс не является формальным понятием, а результаты экспериментов, в общем случае, характеризуются свойствами, не известными априори исследователю. Помимо экспериментальных средств получения информации, необходимо использовать системный подход к конструированию проводимого эксперимента, который должен обеспечить точность, правильность и устойчивость полученных выводов.
2. Анализ публикаций по теме исследования
Рассматривая эксперимент с общесистемных позиций, известные ученые характеризуют его как заданный вопрос. М. Планк считал, что «эксперимент есть не что иное, как заданный природе вопрос» [3].
А. Розенблют и Н. Винер, анализируя роль моделей в науке, рассматривали постановку эксперимента как задание определенного вопроса. «Любой эксперимент - всегда некий вопрос. Если вопрос неточен, получить точный ответ на него трудно» [4, с. 171].
Рассматривая общую проблематику постановки вопроса и получения на него ответа, И. Кант заключал: «Умение ставить разумные вопросы есть уже важный и необходимый признак ума или проницательности» [5, с. 159].
Приведенные высказывания характеризуют проблему постановки эксперимента лишь качественно и не дают никаких точных рекомендаций о ее решении.
Будем считать, что постановка эксперимента осуществляется для получения многофакторных статистических моделей, линейных по параметрам и, в общем случае, не линейных по факторам системы (процесса, объекта). Проводятся многофакторные эксперименты, и получаемые результаты являются следствием влияния всех трех групп факторов: управляемых, неуправляемых и неконтролируемых. Структура многофакторного уравнения регрессии в общем случае исследователю не известна.
Рассматривая возможность решения проблем планирования эксперимента, д.т.н.
В.В. Налимов считал, что «..хорошая математическая модель - это кардинальный вопрос, стоящий теперь перед нами во всей своей остроте... Достаточно формализованного ответа на вопрос - что есть хорошая модель, по-видимому, вообще нельзя будет найти» [6, с. 3].
Построение статистических моделей относится к решению так называемых обратных задач: по полученным конечным результатам необходимо восстановить структуру влияющих факторов и их взаимодействий.
Получаемые результаты экспериментов включают случайные погрешности исходных данных, а также погрешности их измерений и вычислений. В общем случае необходимо решать некорректно поставленную задачу.
3. Цель статьи
Изложить и обосновать концепцию постановки, проведения и обработки результатов многофакторного экспериментального исследования, целью которого является получение статистических моделей. Решение должно соответствовать корректно поставленной задаче.
4. Формализация постановки эксперимента
Решаемая задача считается корректно поставленной, если: 1) решение существует, 2) решение единственное, 3) малым изменениям исходных данных соответствуют малые изменения конечных результатов.
Анализ условий решения регрессионных задач показывает необходимость использования устойчивого (робастного) плана эксперимента, устойчивых структур статистических моделей и устойчивого оценивания коэффициентов моделей.
Под устойчивым (робастным) планом эксперимента понимается план полного или дробного факторного эксперимента, позволяющий выбрать неизвестные исследователю структуры «истинных» статистических моделей ум1 полиномиального вида, линейных по параметрам, и получить адекватные модели (w - текущий номер определяемой модели, 1 < w < m , m - общее число определяемых моделей по устойчивому плану эксперимента). План эксперимента не изменяется для получаемых различных структур моделей.
Многофакторные математические модели будут характеризоваться необходимыми статистическими свойствами, если план эксперимента будет соответствовать критериям Б-, А-, Е-, О-, Q-оптимальности (теория планирования эксперимента).
План эксперимента должен соответствовать критерию ортогональности, тогда коэффициенты модели bi, bj статистически независимы и любой из коэффициентов может
быть вычислен независимо от того, известны ли значения других коэффициентов. По теореме В.З. Бродского, в любом полном факторном эксперименте все эффекты ортогональны друг к другу [2, с. 126]. Расширенная матрица X главных эффектов и взаимодействий содержит столбец фиктивного фактора x0 = 1, столбцы всех главных
эффектов и всех возможных взаимодействий главных эффектов. Если эффекты факторов и взаимодействий факторов выразить в виде системы ортогональных нормированных контрастов, т. е.
N N
I*“ = о, I*“ х *“=о,
и=1 и=1
N N г ,
1КЯ2 = N ■ Iи-) х *“] = N,
и=1 и=1
то матрица дисперсий-ковариаций примет вид
VI
(х т X)-1 с2 (є ) = (1/ N )Ес2 (є) ,
где х(ир) - значение р -го ортогонального контраста і -го фактора для и -й строки матрицы планирования, 1 < и < N, 1 < р < яі -1;
- значение q -го ортогонального контраста у -го фактора для и -й строки матрицы планирования, 1 < q < -1, 1 < і < у < к;
X - матрица эффектов полного факторного эксперимента;
с2 (є) - теоретическое значение дисперсии воспроизводимости результатов опытов;
N - число опытов в плане эксперимента;
Е - единичная матрица.
Ортогональный многофакторный план эксперимента является максимально устойчивым (робастным) при получении не известной ранее исследователю структуры модели и оценке ее коэффициентов. Главные эффекты и некоторые их взаимодействия дробного факторного эксперимента будут ортогональными, если план эксперимента отвечает условию пропорциональности частот уровней, т.е. относится к многофакторным регулярным планам экспериментов [2, с. 146-150].
Полный факторный эксперимент соответствует всем критериям робастного плана эксперимента. Статистические модели, полученные по планам полных факторных экспериментов, будут «наилучшими» из возможных моделей и, следовательно,
«истинными». Для дробных факторных экспериментов обеспечить соответствие всем критериям робастных планов не представляется возможным. Анализ известных дробных факторных экспериментов показал, что наилучшими свойствами характеризуются многофакторные регулярные планы и планы на основе ЛПТ равномерно распределенных последовательностей [2, с. 159-169].
Разработан новый подход формализованного выбора устойчивых структур многофакторных статистических моделей, линейных относительно параметров и, в общем случае, нелинейных по факторам.
Устойчивая структура многофакторной статистической модели - структура, которая характеризуется неизменностью множества главных эффектов и взаимодействий многофакторной статистической модели полиномиального вида при изменении значений результатов экспериментов (откликов), порождаемых случайными ошибками
(погрешностями) результатов наблюдений, измерений, вычислений и неопределенностью искомой структуры модели. Структурные элементы моделей выбираются из множества структурных элементов модели полного факторного эксперимента с ортогональными или слабо коррелированными (коэффициент парной корреляции ^ | < 0,3) эффектами с
использованием устойчивого (робастного) плана эксперимента.
Впервые предложено структуру многофакторной статистической модели, не известной ранее исследователю, выражать в виде множества эффектов:
П (1+ *г(1) + *(2) +... + х(“-1)) ® Nп,
1=1
где 1 - значение фиктивного фактора х0 ° 1; х(1), х(2),..., х(-1) - ортогональные контрасты факторов Х1; к - общее число факторов, 1 < I < к; (1), (2), ..., (^г. -1) - порядок контрастов фактора Х{; ^ - число различных уровней для факторов Х{; ^ - число структурных
элементов полного факторного эксперимента, равное числу опытов эксперимента.
Структура включает множество главных эффектов и множество взаимодействий главных эффектов, необходимых и достаточных для получения адекватных статистических моделей. Необходимость обосновывается теоремами Вейерштрасса, Стоуна, Джексона, а достаточность подтверждается многочисленным использованием структуры для адекватной аппроксимации различных полных и дробных факторных экспериментов.
Для получения «наилучших» структур статистических моделей необходимо выполнение следующих условий: 1) статистическая независимость коэффициентов моделей, 2) статистическая значимость коэффициентов, 3) соответствие плана эксперимента устойчивому (робастному) плану, 4) эффекты, введенные в модель, должны быть нормированы.
Необходимо также обеспечить устойчивость коэффициентов модели. Под устойчивостью коэффициентов статистической модели будем понимать минимально возможную изменчивость коэффициентов многофакторной статистической модели полиномиального вида к случайным ошибкам (погрешностям) результатов наблюдений, измерений и вычислений.
Для оценки устойчивости коэффициентов используется критерий Неймана-Г олдстейна:
р(хт х
где Атах, Ат1П - максимальное и минимальное собственные числа для информационной матрицы Фишера XтX, и мера обусловленности
d (X T X )= X T X x (X T X )-1
conc
где || -1| - обозначение нормы матрицы.
Предполагается, что матрица XTX не вырождена.
Если все эффекты в расширенной матрице X ортогональны друг к другу и нормированы, то обе меры равны 1, и коэффициенты будут максимально устойчивы.
Устойчивость коэффициентов модели наилучшая, если cond = 1, хорошая 1 < cond < 10, удовлетворительная 10 < cond < 100, неудовлетворительная cond > 100 .
Каждый коэффициент будет определяться независимо от других коэффициентов модели. Полученная статистическая модель будет соответствовать наилучшим статистическим свойствам: адекватность, информативность, устойчивость, статистическая эффективность, семантичность (информационная) и др. Следовательно, эксперимент как вопрос будет поставлен наилучшим образом, так как будет решаться корректно поставленная задача.
Разработанные методы устойчивого оценивания многофакторных статистических моделей позволяют надежно решать поставленные задачи прогнозирования, оптимизации, автоматизированного управления, изучения механизмов происходящих явлений.
Была решена задача информационной коррекции переменных систематических погрешностей средств измерений и измерительных информационных систем [7]. Исследовалась зависимость измеряемой величины y(d) (показание датчика) от факторов Х1 (гистерезис), Х2 (температура окружающей среды), Х3 (напряжение питания), Х4 (измеряемый
вес). Структура статистической модели была не известна.
С использованием системы ортогональных контрастов структура полного факторного эксперимента для перечисленных выше факторов будет иметь следующий вид:
(1 + Х1 )(1 + Х2 + Z2 )(1 + x3 + Z3 )(1 + x4 + z4 + g 4 + V4 + W4 )® ^108 ,
где x1,...,x4, z2,...,z4, g4, v4, w4 - соответственно линейные, квадратичные, кубический,
четвертой и пятой степени ортогональные контрасты факторов Х1,..., Х4;
N108 - число структурных элементов для схемы полного факторного эксперимента.
Использовался полный факторный эксперимент 21х32хб1//108. Модель была получена, и все проверки были проведены с использованием программного средства «Планирование, регрессия и анализ моделей» (ПС ПРИАМ) [2, с. 45-47].
Полученная модель имеет вид
y(D)= 28968,9-3715,13x4 + 45,2083x3 -37,5229z2 + 23,1658x2 -19,0708z4 -
- 19,6574z3 -9,0094x2z3 -9,27434z2x4 + 1,43465x1 x2 + 1,65431z2x3,
где x1 = 2( Х1 - 0,5);
x = 0,0306122(Х2 -27,3333); z2 = 1,96006(x22 -0,237337x2 -0,575594);
х3 = 3,33333(Х3 -12); г3 = 1,5(х32 -0,6666667); х4 = 0,02(X4 -50); г4 = 1,875(х42 -0,466667);
^4 = 3,72024(х4 -0,808х4); у4 = 7,59549(х4 - 1,08571х42 +1,1296).
Все коэффициенты модели статистически значимы. Модель адекватна, высокоинформативна и максимально устойчива, семантична в информационном смысле. Модель позволяет провести содержательный информационный анализ влияния факторов и их взаимодействий на моделируемый критерий качества: раскрыть нелинейность средства
измерения и системное влияние факторов (эмергентность) внешней среды и внутренних условий. С использованием модели точность измерений может быть повышена на порядок.
Успешно также была решена задача математического моделирования и компромиссной оптимизации технологического процесса электроэрозионной прошивки отверстий [8]. Структуры моделей заранее были не известны.
В этом исследовании критериями качества являются:
у1 - производительность обработки П, мм /мин; П — max ;
у2 - износ электроэрозионного инструмента J, %; J — min .
Использовался регулярный дробный факторный план эксперимента 35//27, который содержит 27 опытов и является равномерным планом; каждый опыт повторялся дважды. Каждый из 5 факторов варьировался на 3 уровнях: X1 (давление прокачиваемой жидкости), Х2 (рабочий ток в межэлектродном зазоре), Х3 (частота импульсов), Х4 (напряжение на вибраторе), Х 5 (напряжение на двигателе подачи электроинструмента). Структурные составляющие моделей выбирались с использованием алгоритма RASTA3 [2, с. 179-180] из множества элементов структуры полного факторного эксперимента, которая имеет следующий вид:
(l + Xi + Zi )х (l + Х2 + Z2 )x X (l + X5 + Z5 ) —— NП .
С применением ПС ПРИАМ получены модели:
у = 88,80 + 27x2 + 10,56Хз + 4,85z2z3 -3,15z2 + 2,28xx + 2,89z2x3 - 1,70z3; y2 = 54,89 + 5,38x1 + 4,31x3 + 3x3x4z5 + 2,75z1x2 z3 + 2,56z1x2 z5 + 3,29z1z2 z4,
где x1 = 2(X1 -1), z1 = 1,5(x12 -0,666667); x2 = 0,25(X2 -22), z2 = 1,5(x22 =-0,666667); x3 = X3 - 3, z3 = 1,5 (x32 - 0,666667); x4 = 0,05(X4 - 70), z4 = 1,5(x42 - 0,666667); x5 = 0,05(X5 - 80), z5 = 1,5(x52 - 0,666667).
Обе построенные модели у и j)2 адекватны, высокоинформативны, максимально устойчивы, статистически эффективны.
В результате проведенной с использованием полученных статистических моделей многокритериальной (компромисс по Парето) оптимизации было найдено оптимальное сочетание уровней факторов, влияющих на критерии качества процесса электроэрозионной прошивки отверстий.
С областями использования разработанной методологии и полученными результатами можно ознакомиться в [9].
5. Выводы
1. Успешно реализован системный подход в получении многофакторных статистических моделей, который позволяет создавать надежную и устойчивую систему постановки эксперимента и получать корректное решение задач. Эксперимент как вопрос ставится максимально точно, и решается корректно поставленная задача.
2. Получаемые статистические модели позволяют установить причинные, структурные и количественные связи между группой управляемых факторов и моделируемыми критериями качества систем, процессов, объектов. Модели соответствуют критерию семантичности в информационном смысле. Их можно использовать для прогноза, автоматизированного управления, оптимизации, изучения механизмов происходящих явлений.
СПИСОК ЛИТЕРАТУРЫ
1. Радченко С.Г. Системные статистические свойства экспериментального метода исследования /
С.Г. Радченко // Математичні машини і системи. - 2006. - № 4. - С. 83 - 89.
2. Радченко С.Г. Устойчивые методы оценивания статистических моделей / Радченко С.Г. - К.: ІIII «Санспарель», 2005. - 504 с.
3. Грубба К. Научное приборостроение и автоматизация / К. Грубба, Н. Лангхофф, Г. Петер // Материалы III Международной школы по автоматизации научных исследований (Пущино, июнь 1988 г.). - Пущино: АН СССР, 1990. - С. 34 - 52.
4. Неуймин Я.Г. Модели в науке и технике. История, теория, практика / Неуймин Я.Г.; под ред. Н.С. Соломенко. - Л.: Наука, Ленинград. отд., 1984. - 190 с.
5. Кант И. Сочинения: в 6 т. / Кант И.; под общ. ред. В.Ф. Асмуса и др. - М.: Мысль, 1964. - Т. 3. -799 с.
6. Налимов В.В. Планирование эксперимента. Найдут ли новые проблемы новые решения? /
В.В. Налимов // Журнал Всесоюзного химического общества им. Д.И. Менделеева. - 1980. - Т. 25, № 1. - С. 3 - 4.
7. Радченко С.Г. Информационная коррекция переменных систематических погрешностей средств измерений и измерительных информационных систем / С.Г. Радченко, П.Н. Бабич // Радиоэлектроника и информатика. - 1999. - № 3(8). - С. 82 - 88.
8. Радченко С.Г. Багатофакторне математичне моделювання та компромісна оптимізація технологічного процесу електроерозійного прошиття отворів / С.Г. Радченко // Математичні машини і системи. - 2003. - № 3, 4. - С. 186 - 200.
9. Лаборатория экспериментально-статистических методов исследований [Электронный ресурс]. -Режим доступа: http://www.n-t.org/sp/lesmi/.
Стаття надійшла до редакції 13.05.2010