УДК 519.240
ВЫБОР ЧИСЛА ВЫЧИСЛИТЕЛЬНЫХ ЭКСПЕРИМЕНТОВ ПРИ РЕШЕНИИ ЗАДАЧ ИССЛЕДОВАНИЯ И ОПТИМИЗАЦИИ ДИНАМИЧЕСКИХ СИСТЕМ МЕТОДОМ ПЛП-ПОИСКА
© И.Н. Статников, Г.И. Фирсов
Ключевые слова: планирование вычислительных экспериментов; ЛП-сетки; имитационное моделирование; регрессионный анализ.
Даются рекомендации по выбору необходимого числа вычислительных экспериментов при решении задач оптимального проектирования динамических систем методом планируемого ЛП-поиска.
В методе планируемого ЛП-поиска (ПЛП-поиска) [1-2], созданном для решения задач оптимального проектирования механизмов и машин на предварительном этапе, важным является статистический анализ результатов, получаемых при моделировании на ЭВМ. Этот анализ целиком базируется на идеях дисперсионного анализа [3], и поэтому его эффективное применение зависит от выбора оценочной функции (критерия значимости) и объема N проводимых на ЭВМ машинных экспериментов. С помощью дисперсионного анализа осуществляют проверку различных статистических гипотез. В частности, в ПЛП-поиске используется следующая нулевая гипотеза Н0: если средние значения
Ф ¡(а,) критерия качества проектируемой машины статистически не отличаются друг от друга и от общего
среднего Ф 0( а ) всей совокупности N экспериментов, то полагаем, что рассматриваемый исследуемый параметр аj (- = 1, 2, ..., г) не оказывает в среднем влияния на величину Ф ( а ); при этом г = 1, ... М,, а М- - количество уровней, на которые разбивается в ПЛП-поиске диапазон изменения а,-.
Для количественной оценки справедливости выдвигаемой нулевой гипотезы (или ей альтернативной гипотезы Н1) в математической статистике рассматриваются оценочные функции, в том или ином виде используемые при сопоставлении выборочных характеристик, в частности, составляющих дисперсии ст^ всей совокупности проделанных экспериментов (или их несмещенных оценок). Проверка справедливости статистических гипотез при использовании оценочных функций основывается на сравнении некоторого числового показателя, найденного по результатам экспериментов, с табличными значениями оценочных функций при некоторых значениях доверительных вероятностей р, что адекватно доверительному уровню значимости 1 - р. Таблицы теоретических значений вероятностей оценочных функций строятся на основе известных в математической статистике распределений (нормального, биномиального, распределения Рэлея
и др.) [3].
Среди множества существующих оценочных функций параметрического типа, применение которых зави-
сит от вида эмпирического распределения наблюденных результатов, в ПЛП-поиске был выбран критерий Фишера F (или дисперсионное отношение), который равен
F = s?/ s¡ , (1)
2 2
где 5 - оценка дисперсии. Нужно брать 5] > 52 . При этом большему значению ^ соответствует число степеней свободы V!.
Суть формулы (1) состоит в том, что если отношение двух оценок дисперсий ^ и при фиксированных V! и V2 и заданном уровне значимости 1 - р больше табличного значения FT, рассчитанного для тех же условий, то нулевая гипотеза отвергается; если же F < FT, то гипотеза принимается, т. е. полагается, что 2 2
5 и несущественно отличаются в статистическом смысле, и выборки однородны, т. е. взяты из одной нормальной совокупности (для этих целей рассчитаны таблицы значения критерия FT, при разных V!, V2 и р, например, табл. ХУШ-ХХ1 из [3]). Из сказанного ясно, что эффективность применения критерия F зависит от степени приближения распределения результатов экспериментов (вернее, выборочных средних) к нормальному распределению. Распределение средних выборочных носит характер кривой Гаусса, и в этом заложено объективное свойство распределения Ф ¡(а,). И это свойство не зависит от того, как распределяется сама случайная величина Ф (а ). Разница состоит лишь в том, что при нормальном распределении самой величины Ф (а ) распределение средних выборочных
Ф ¡(а,) не зависело бы от объема выборки.
Следует отметить, что результативность использования большинства оценочных функций параметрического типа также существенно зависит от степени близости эмпирического распределения к нормальному. Поэтому на вопрос, какая же из оценочных функций наиболее логически оправдана, в статье Р.К. Бауэра [4] дается следующий ответ: «Этот спор, без сомнения,
решается в пользу F-показателя Р.А. Фишера, в котором прямо и попросту сопоставляются обе компоненты общего рассеяния, характеризующие стохастическую модель испытаний». Кроме того, из многих оценочных функций параметрического типа критерий Фишера менее других чувствителен к отклонениям эмпирических распределений от нормального [5].
Естественно, что степень отклонения экспериментальных данных от нормального распределения зависит от объема N экспериментов, более конкретно - от числа выборок. Эта зависимость вытекает из центральной предельной теоремы Ляпунова [6] в теории вероятностей, которая утверждает, что какова бы ни была исходная совокупность, при достаточно большом числе независимых испытаний распределение выборочных средних стремится к нормальному с дисперсией
ст^ / N , где ст^ - дисперсия исходной совокупности. При практическом использовании метода ПЛП-поиска задаются и определяются следующие параметры матрицы планирования экспериментов на ЭВМ: r - число исследуемых параметров a-, M- - число уровней; Tj -число реализаций (экспериментов) на j-м уровне j-го параметра. Общее число всех машинных экспериментов при этом равно N = MjT, если M- - const и Tj = const
M,
или N =
^ Ti, если Tj ф const. Число уровней M- выби-
рается из следующих соображений. С одной стороны, из соображений равномерного характера распределения [7] М- должно быть кратно степени двойки, т. е. М- = 21 (I = 1, 2,...). С другой стороны, число Mj определяется с той тщательностью, с которой исследователь считает необходимым просмотреть заданный диапазон изменения каждого параметра а,.
В большинстве решавшихся авторами практических задачах проектирования механизмов на основе ПЛП-поиска [8] диапазоны варьируемых параметров в основном разбивались на 16 сечений (М- = 16). Покажем, что в этих задачах распределение средних значений Ф ,(а,) также близко к нормальному. Для этого воспользуемся следующим критерием согласия эмпирического распределения с нормальным [9]. Если выборочные асимметрия и эксцесс удовлетворяют неравенствам
A £ WD(A) и \E\ £ D(E)
(2)
то наблюдаемое эмпирическое распределение можно считать нормальным. При этом выборочные асимметрия и эксцесс определяются по следующим формулам:
A = ■
Ms
j
L3 Z [Ф i (a j )-Ф (a)]5,
j i=1 m .
E = ¡^7 i (a j )-фо (a)]4.
(3)
j ¿=1
Для расчета дисперсий ЩА) и Д(Е) в [9] приводятся следующие формулы:
6(M -1)
D( A) =-^—-
D( E) =
(4)
(Mj + 1)(Mj + 3) 24Mj (Mj - 2)(Mj - 3) (M + 1)2(M + 3)(M + 5)'
где М- соответствует объему выборки.
Как подчеркивается в [9], приведенный критерий согласия является приближенным и годится при значе-нияхМ ^ 20.
Приведем результаты расчетов по формулам (2) -(4) для тестовой функции Розенброка
Ф(а) = 100(а2 -а2)2 + (1 -а,)2; 0= £ } [10].
I а е (-0,5;3,5)1
При этом при Mj = 16 D(A) = 1,58 и 5^D(E) =3,89.
Для a1 | A = 1,19; |E = 0,51; для a2 |A| = 0,95, \e\ = = 0,95.
Известно, что увеличение общей совокупности N машинных экспериментов делает более достоверными те статистические выводы, которые мы стремимся получить. Такое понимание роли объема N проводимых на ЭВМ экспериментов соответствует и интуитивному желанию при использовании ПЛП-поиска получить определенные статистические оценки при достаточно полном дискретном обзоре пространства исследуемых параметров, в отличие от ситуации, когда исследователь a priori знает или подозревает область нахождения оптимальных решений. Поэтому для определения общего числа N проводимых на ЭВМ экспериментов нужно привлечь следующие рассуждения. С одной стороны, при планировании экспериментов нижняя граница количества опытов, проводимых в r-м пространстве параметров, должна удовлетворять следующему соотношению [5]:
N* ^ r + С
(5)
где Сг - число сочетаний (взаимодействий) из г элементов по к (к = 2, ..., г - 1). С другой стороны, при процессе производства экспериментов на ЭВМ с использованием ЛПт-сеток можно полагать, что дисперсия воспроизводимости машинных экспериментов равна нулю (при условии, что ЭВМ работают в режимах, предусмотренных техническими условиями). Поэтому, учитывая, что в ПЛП-поиске процесс дискретного обзора пространства исследуемых параметров рандоми-зирован, можно говорить о вероятности Р нахождения лучших решений в области, составляющей Ь-ю часть исходного пространства после проведения М** экспериментов. Три указанные величины связываются следующим уравнением [10]:
P = 1-(1-L)
n **
(6)
Некоторые результаты расчетов по уравнению (6) приведены в табл. 1.
Учитывая, что для задач проектирования механизмов и машин чаще всего имеет смысл рассматривать лишь эффекты взаимодействий параметров первого и,
i=1
Таблица 1
Оценка числа экспериментов М*
Р Ь
0,20 0,15 0,10 0,05 0,03 0,01 0,005 0,001
0,70 5 7 12 22 40 130 260 1300
0,75 6 8 13 25 46 150 300 1500
0,80 7 10 16 29 54 175 350 1750
0,85 9 12 18 34 63 205 410 2050
0,90 10 14 22 41 77 250 500 2500
0,95 14 18 30 54 100 325 650 3250
0,98 18 26 38 70 130 425 850 4250
0,99 21 29 44 83 154 500 1000 5000
0,995 24 34 51 96 177 575 1150 5750
реже, второго порядка (к = 2, 3), получаем по формуле (5) для г < 40 и к = 2, что N > 820, а для г <17 и к = 2, 3 - N > 832. В то же время наиболее интересная в практическом отношении часть табл. 1 (выделена жирной линией) при различных Р и Ь содержит значения №** от 22 до 850, которые можно рассматривать как верхнюю границу необходимого числа экспериментов. При этом, конечно, остаются в силе и соображения стоимостного характера. Например, при г = 10 и к = 2 N = 55. Из табл. 1 видно, что при М* = 70 мы с вероятностью Р > 0,98 будем уверены, что область, содержащая лучшие решения, составит не более 5 % от исходной области поиска Если же мы хотим, чтобы Ь < 0,01 от исходной области при той же вероятности Р > 0,98, то М* = 425; при этом, если данное количество экспериментов нас не устраивает по стоимостным и временным причинам (а часто первая причина - следствие второй), то помня, что N = 55, можно назначить = 175. Однако теперь вероятность того, что Ь < 0,01, от исходной области поиск; ниже, чем в предыдущем случае, но все еще практически приемлема (Р > 0,80). Слово «практически» употреблено в том смысле, что вся процедура метода ПЛП-поиска рекомендуется к использованию на предварительном этапе решения задачи проектирования технического устройства (научно-исследовательском), когда основная цель состоит не только в достижении абсолютных результатов (что не отвергается), а в получении объективной информации о свойствах исследуемых параметров по отношению к критериям качества проекта.
Отметим также, что, выбрав число N из диапазона ^ < N < руководствуясь всеми изложенными выше соображениями, мы тем самым однозначно определяем число перестановок Тг, необходимое для образования матрицы планирования экспериментов: Тг = ММ-. Исходя из рекомендаций математической статистики [3], следует стремиться к тому, чтобы Т1 > 10, что также может явиться дополнительным аргументом при выборе числа N. При г > 40 и к = 2 и при г > 17 для к = 2, 3 число N, определяемое по формуле (5), достаточно близко по величине к крайним значениям ^* в табл. 1, поэтому в таких задачах это число и следует принимать в качестве N = ^. Таким образом, вопрос об априорном назначении объема N вычислительных экспериментов не может быть разрешен для всех задач вообще, т. к. значение N в первую очередь
зависит от вида поверхности Ф ¡(а,), что чаще всего
неизвестно перед началом экспериментов. Однако несколько общих моментов в подходе к выбору значения можно высказать.
Исходя из возможности описать стационарную область концентрации наилучших решений О(а) некоторым полиномом степени << (регрессионная зависимость) нижнюю границу ^ можно определить следующим образом [4]: М* > а . На основе априорных физических представлений о чувствительности к-го критерия качества к вариациям ,-го параметра можно потребовать, чтобы 8а,- и Аа-/М-, Естественно ориентироваться на максимальное значение М-, полученное по этой формуле. Пространство в исходной области О(а) изменения параметров, объем которой
г
8у = | |8а , будем рассматривать как элементар-
1
ную г-мерную ячейку. Тогда, исходя из свойств квазиравномерного распределения точек в области О(а)
[5], можно считать, что (8У / V) и N° /М, где V -
объем области О(а) , М0 - число точек из N, попавших в элементарную ячейку. Справедливым будет при квазиравномерном распределении точек а в области О(а) рассматривать значение и = N° / М, как вероятность обнаружения экстремального значения к-го критерия качества Ф£ с одного испытания (эксперимента). Очевидно, что с ростом г значение и достаточно мало. Тогда высокие значения вероятности Р обнаружения Фк (а) = Ф^ после проведения ^* экспериментов определяются соотношением Р = 1 — (1 — и)М** . Естественно полагать, что стационарная область, для которой справедливо ее описание полиномом степени < (а по существу это есть разложение Ф^ (а) в точке а+ в ряд Тейлора), никак не меньше области, рассматриваемой как элементарная ячейка. Отсюда можно считать, что общее число точек N определяется двумя границами М* < N < N ** .
По поводу назначения самой величины М-, из (9) следует подчеркнуть, что там, где это возможно, следует брать М,, кратный степени двойки, что способствует квазиравномерности распределения точек а [7].
ЛИТЕРАТУРА
1. Статников И.Н., Фирсов Г.И. Метод ПЛП-поиска в решении общей задачи нелинейного программирования // Гаудеамус. Психолого-педагогический журнал. Тамбов, 2010. № 2 (16). С. 368370.
2. Статников И.Н., Фирсов Г.И. Об одном комбинационном способе численного исследования функций // Гаудеамус. Психолого-педагогический журнал. Тамбов, 2011. № 2 (18). С. 176-178.
3. Митропольский А.К. Техника статистических вычислений. М.: Наука, 1971. 576 с.
4. О теории дисперсий: сб. ст. / сост. Н.С. Четвериков. М.: Статистика, 1968. 239 с.
5. Налимов В.В. Теория эксперимента. М.: Наука, 1971. 208 с.
6. Дружинин Н.К Логика оценки статистических гипотез. М.: Статистика, 1973. 212 с.
7. Соболь И.М. Многомерные квадратурные формулы и функции Хаара. М.: Наука, 1969. 288 с.
8. Статников И.Н., Андреенков Е.В. ПЛП-поиск - эвристический метод решения задач математического программирования. М.: ИИЦ МГУДТ, 2006. 140 с.
9. Пустыльник Е.И. Статистические методы анализа и обработки наблюдений. М.: Наука, 1968. 288 с.
10. Уайлд Д.Дж. Методы поиска экстремума. М.: Наука, 1967. 268 с.
Поступила в редакцию 13 апреля 2015 г.
Statnikov I.N., Firsov G.I. CHOICE OF NUMBER OF CALCULATING EXPERIMENT DURING SOLVING PROBLEM OF RESEARCH AND OPTIMIZATION OF DYNAMIC SYSTEMS BY METHOD OF PLP-SEARCH
Recommendations on choice of the necessary number of calculating experiments during solving problems of optimal projecting of dynamic systems by method of the planned LP-search are given.
Key words: planning of calculating experiments; LP-net; im-itational modeling; regression analysis.
Статников Исаак Наумович, Институт машиноведения им. А.А. Благонравова РАН, г. Москва, Российская Федерация, кандидат технических наук, ведущий научный сотрудник, e-mail: [email protected]
Statnikov Isaak Naumovich, Institute for Machine Science named after A.A. Blagonravov of Russian Academy of Sciences, Moscow, Russian Federation, Candidate of Technics, Leading Scientific Worker, e-mail: [email protected]
Фирсов Георгий Игоревич, Институт машиноведения им. А.А. Благонравова РАН, г. Москва, Российская Федерация, старший научный сотрудник лаборатории компьютерных технологий исследований оператора и машины, е-mail: [email protected]
Firsov Georgiy Igorevich, Institute for Machine Science named after A.A. Blagonravov of Russian Academy of Sciences, Moscow, Russian Federation, Senior Scientific Worker of Computer Technologies of Research of Operator and Machine Laboratory, е-mail: [email protected]