УДК 519.6 Дмитриева Татьяна Львовна,
д. т. н., профессор кафедры «Сопротивление материалов и строительная механика», НИИрГТУ,
тел. 89149136725, e-mail: [email protected] Нгуен Ван Ты,
аспирант кафедры «Сопротивление материалов и строительная механика», НИ ИрГТУ,
тел. 89246020079, e-mail: [email protected]
РЕАЛИЗАЦИЯ УСЛОВНОЙ ЗАДАЧИ НЕЛИНЕЙНОГО МАТЕМАТИЧЕСКОГО ПРОГРАММИРОВАНИЯ С ИСПОЛЬЗОВАНИЕМ МЕТОДА ДЕФОРМИРУЕМОГО МНОГОГРАННИКА В ПРОГРАММЕ MATHCAD
T. L. Dmitrieva, Nguyen Van Tu
REALIZATION OF CONDITIONAL TASKS OF NONLINEAR MATHEMATICAL PROGRAM USING POLYHEDRA DEFORMABILITY METHOD IN THE MATHCAD SOFTWARE
Аннотация. Рассмотрена задача на условный экстремум, формализованная в виде задачи нелинейного математического программирования. Решение ищется с использованием функции Лагранжа, а также её модификации, обладающей более широкой областью сходимости и применимой для отыскания локального экстремума в невыпуклых задачах. Модификация функции Лагранжа достигается путем введения в нее штрафа за нарушение ограничений задачи, в результате чего множество седловых точек функции Лагранжа остается неизменным, но улучшаются свойства этой функции. Таким образом обеспечивается сходимость для более широкого класса задач и с большей скоростью. Модифицированную функцию Лагранжа можно трактовать и как модификацию штрафных функций, когда в структуру штрафной функции вместо целевой вводится функция Лагранжа. Трудоёмкость метода определяется трудоёмкостью решения вспомогательной задачи на безусловный экстремум, которая должна быть решена относительно точно. При этом необходимо, чтобы точность вычисления переменных варьирования (исходных переменных) соответствовала точности вычислений двойственных переменных (множителей Лагранжа). Тогда, учитывая, что способ вычисления двойственных переменных, используемый в алгоритме, имеет линейную скорость сходимости, для решения задачи безусловного экстремума по исходным переменным целесообразно применять градиентные методы первого порядка либо прямые поисковые методы (метод случайного поиска, метод деформируемого многогранника и др.). В данной статье использован метод деформируемого многогранника, который был разработан Нельдером и Мидом (оригинальное название A Simplex Method). Алгоритм решения условно-экстремальной задачи реализован в программе MathCAD. Исследовано влияние величины штрафного коэффициента, входящего в модифицированную функцию Лагранжа, на сходимость алгоритма.
Ключевые слова: метод деформируемого многогранника, нелинейное математическое программирование, модифицированная функция Лагранжа, безусловный экстремум, штрафные функций, программа MathCAD.
Abstract. The problem of conditional extremum formalized in the form of non-linear mathematical programming is considered. The solution is sought using the Lagrange function, as well as its modification, which has a wider domain of convergence and applicable for finding local extremum in nonconvex problems. Modification of the Lagrange function is achieved by introducing into it a fine for violation of the restrictions of the problem, resulting in a set of saddle points of the Lagrangian remains unchanged, but properties of this function are improved. Thus, ensuring convergence for a wide class of problems, and with greater speed is provided. Modified Lagrange function can be interpreted as a modification of the penalty function when the structure of the penalty function instead of the target function is introduced Lagrange. The complexity of the method is determined by the labor-intensive solutions supporting unconditional extremum problem that must be solved relatively accurately. Thus the accuracy of the variables variation (the original variables) calculation have to correspond to the calculation accuracy of the dual variables (Lagrange multipliers). Then, taking into account that the method of calculating the dual variables used in the algorithm has a linear rms-convergence rate for solving unconstrained extre-mum in the original variables, it is advisable to adopt prima gradient methods of the first order, or direct search methods (random search method, the method offlexible polyhedron et al.). In this article, we used the method of the flexible polyhedron, developed by Nel-derom and Mead (original title A Simplex Method). Algorithm for solving the conditional extremum problem is implemented in the MathCAD software. The influence of the magnitude of the penalty coefficient included in the modified Lagrange function on the convergence of the algorithm is investigated.
Keywords: flexible polyhedron method, nonlinear mathematical programming, modified Lagrange function, unconditional extremum, penalty function, MathCAD.
Введение
Постановку задачи оптимизации примем в форме задачи нелинейного математического программирования (НМП):
найти min f (х), х е En при ограничениях gt (х)< 0,
gL * X * gU ,
(1)
] = 1,2,...,т; (2) г = 1,2,..., пх. (3) Здесь {X} - вектор варьируемых параметров на интервале }.
Условно-экстремальная задача (1-3) приводится к задаче на безусловный экстремум с использованиями функции Лагранжа ^, а также её
модификации - функции ^ . Подробное описание этих функций приводится в [5, 6]. Алгоритм решения стандартной задачи НМП сводится к двум попеременным шагам: а) определение переменных варьирования х путем минимизации модифицированной функции Лагранжа (МФЛ) б) поиск двойственных переменных у (множителей Лагранжа).
При решении задач оптимального проектирования конструкций наибольшую устойчивость могут обеспечить прямые методы безусловной минимизации. Здесь не требуется выполнение таких условий, как гладкость и дифференцируемость функций цели и ограничений. Рассмотрим случай,
Исходные данные
Формирование функции Fp
Fp = kfFL + 0,5{g}T[ЛИЫ+ 0,5kf {7}T([л]-[/]){AZ}
Пересчет варьируемых параметров минимизацией функции Fp методом деформируемого многогранника
Пересчет двойственные переменные j = maxi 0, y'j + ^g (x'+1 j\
= Г (х)+ {У }т функция
Лагранжа,
кг - нормирующий множитель, {У} - вектор множителей Лагранжа, [л] - диагональная матрица булевых переменных,
[к] - диагональная матрица штрафных коэффициентов, элементы которой определяются из выражения:
к'+1 У'+
к/ у] ^ т
[/ ]- единичная матрица,
- ось невязок ограничений, К2 тах, кт;п - заданные константы.
kt+1 yt+1 k' = kf У
+ k„
Рис. 1. Блок-схема алгоритма
когда внутренняя задача минимизации функции Fp решается с использованием методом деформируемого многогранника на параметрических ограничениях, определяющих область поиска. Покажем постановку этой задачи:
найти min f (x) (4)
g № }-{x }< o,
решения условной задачи НМП
при ограничениях
{gu }={X}-{xu }< 0.
(5)
Здесь /(х) - функция, минимизируемая на гиперпараллелепипеде (например, модифицированная функция Лагранжа ^). Вектор {X} имеет размерность п, а - соответственно нижние и верхние границы изменения параметров этого вектора.
Метод деформируемого многогранника, предложенный Нелдером и Мидом [1, 3], оказался весьма эффективным и легко осуществимым на ЭВМ. Чтобы оценить стратегию Нелдера и Мида, кратко опишем симплексный поиск Спендли, Хек-ста и Химсворта, разработанный в связи со статистическим планированием эксперимента. Вспомним, что регулярные многогранники в Е являются симплексами. Например, как видно из рис. 2, для случая двух переменных регулярный симплекс представляет собой равносторонний треугольник (три точки); в случае трёх переменных регулярный симплекс представляет собой тетраэдр (четыре точки) и т. д.
Рис. 2. Регулярные симплексы для случая двух (а) и трёх (б) независимых переменных
При поиске минимума целевой функции /(X) пробные векторы X могут быть выбраны в точках Е, находящихся в вершинах симплекса, как было первоначально предложено Спендли, Хекстом и Химсвортом.
Из аналитической геометрии известно, что координаты вершин регулярного симплекса определяются матрицей В, в которой столбцы представляют собой вершины, пронумерованные от 1 до (п + 1), а строчки - координаты, I принимает значения от 1 до п:
" 0 dj d2 . .. d2
0 d2 d . .. d2
D = 0 d2 d. .. d2 - матрица n x (n + 1),
0 d2 d. .. d
где
d\ =-
(л/2
и
n +1 + n -1
) ,
a
d2 =-
г42
(jn + 1 -1),
X(' ) = X
(t)
+ a(x(t) - ХЦ)),
a - расстояние между двумя вершинами
В методе Нелдера и Мида симплекс может изменять свою форму и, таким образом, уже не будет оставаться симплексом. Именно поэтому здесь использовано более подходящее название «деформируемый многогранник». Здесь минимизируется функция n независимых переменных с использованием n + 1 вершины деформируемого многогранника в E1. Каждая вершина может быть идентифицирована вектором X. Вершина (точка) в E1, в которой значение f (X) максимально, проектируется через центр тяжести (центроид) оставшихся вершин Улучшенные (более низкие) значения целевой функции находятся последовательной заменой точки с максимальным значением f (X) на более «хорошие точки», пока не будет найден минимум f (X).
Алгоритм может быть описан следующим образом [4]. Пусть
X« = [х£),...,Xf,..„X^Г,i = 1,.,n +1, является i-й вершиной (точкой) в E на t-м этапе поиска, t = 0, 1, ..., и пусть значение целевой функции в Xf) равно f( Xf)). Кроме того, отметим те векторы X многогранника, которые дают максимальное и минимальное значения f (X). Определим
f (x?))= max{/(Xf)) ..., f (X« )} где X?) = Xf), и
f (x() )= min{f (Xf))..., f (x™ )} где X(t = X(t). Поскольку многогранник в E состоит из (n + 1) вершинX1, ..., Xn +1, пусть Xc(t) бу-
(t)
X(j =1
n
IX01- X?
j = 1, .,n,
(7)
где а > 0 является коэффициентом отражения.
б) Растяжение. Эта операция заключается в следующем: если /(X'') )< /(х^)), то вектор
(X'') - Х()) растягивается в соответствии с соотношением
+ у
где у >1 представляет собой коэффициент растяжения. Если /(х^')) < /(х()), то X'') заменяется на X(')
X) = X(t) + у(х() - X(t)) (8)
и процедура продолжается снова с опе-
(t)
за-
рации 1 при + 1. В противном случае Хь
меняется на Х() и также осуществляется переход к операции 1 при + 1.
в) Сжатие. Если /(хг(') )> /(х/')) для всех I #к, то вектор (х(') - X(')) сжимается в соответствии с формулой
Х(*) = ХС') +МХн ) - X?)) (9)
где 0 < р < 1 представляет собой коэффициент сжатия. Затем X];0 заменяем на X'0 и возвращаемся к операции 1 для продолжения поиска на (t + 1)-м шаге.
г) Редукция. Если /(хr(') )> /(х^)),
все векторы (X,'0 -XI0), 1 = 1, ...,п + 1, уменьшаются в 2 раза с отсчётом от X/(') в соответствии с формулой
X? = Х(,) + 0,5(Х(,) -Х(,)) 1 = 1, ...,п + 1. (10) Затем возвращаемся к операции 1 для продолжения поиска на (, + 1)-м шаге.
Критерий окончания поиска, использованный Нелдером и Мидом, состоял в проверке условия
дет центром тяжести всех вершин, исключая X
Тогда координаты этого центра определяются формулой
1
[f X™)- f (Xl°)]
<s,
(11)
(6)
где индекс у обозначает координатное направление.
Начальный многогранник обычно выбирается в виде регулярного симплекса (но это не обязательно) с точкой 1 в качестве начала координат; можно начало координат поместить в центр тяжести. Процедура отыскания вершины в Е, в которой / (X) имеет лучшее значение, состоит из следующих операций:
a) Отражение - проектирование X(') через центр тяжести в соответствии с соотношением
\П+1 г=1
где е - произвольное малое число, а /(X'')) -значение целевой функции в центре тяжести X(').
В качестве удовлетворительных значений этих параметров при оптимизации без ограничений Нелдер и Мид рекомендовали а = 1, р = 0,5 и у = 2. Размеры и ориентация исходного многогранника в некоторой степени влияли на время решения, а значения а, р и у оказывали значительно большее влияние. Павиани отмечает, что нельзя чётко решить вопрос относительно выбора р и у и что влияние выбора р на эффективность поиска несколько более заметно, чем влияние у. Павиани рекомендует следующие диапазоны значений для этих параметров:
0,4 < р< 0,6,
a
i=1
2,8 < у< 3,0.
При 0 < р < 0,4 существует вероятность того, что из-за уплощения многогранника будет иметь место преждевременное окончание процесса. При Р > 0,6 может потребоваться избыточное число
шагов и больше машинного времени для достижения окончательного решения [1].
На рис. 3. приведена блок-схема поиска методом деформируемого многогранника.
Пример
Рассмотрим решение тестовой задачи НМП, где внутренняя задача на безусловный экстремум будем решать с использованием метода деформируемого многогранника:
V ( Л2
найти min f(x) = (x - 2)2 + (x -1)2, x e En при ограничениях
-2 /a-\2
gi =-Xi2/4-X22 -1 <0;
£2 = Х1 _ 2 • х2 +1 < 0.
Блок-схема алгоритма решения задачи изображена на рис. 1. Реализуем этот алгоритм в программе ЫМкСЛВ (рис. 4). На рис. 5 приведен листинг MathCЛD-программы, где реализована подпрограмма ЫМ, которая осуществляет поиск безусловного минимума функции ^ методом деформируемого многогранника соответственно алгоритму, блок-схема которого показана на рис. 3.
Мх):= ¡XI-2)2-(XI- ГГ
(Л-
4х!)
- (Х2)'
X, -1 X, - 1
а:=1р:=0.3 1=2 £ := 0 0000001 и := 2 i := 1 knün := ЗОО AZmax := О2 tf := 1
■1 О
I := :
1.0 1 Нгорацин 1
Xi := 2.5 X: := 1.;
ii - 1..2 55i := Л
rix) = 0L29
'-4.0035"^
1.1 J
yjj kf Уд
kü J := ы T-j— -:= "¡7—
>1.11 I 1 if p x)„ I Л7.р > 0
10 otherwise
/300 0 ■: fc=
V О ЗООу1
ЛЛ '0'
„ : „ :
FLiX; - r(x)-vT.\i(x) Fpix) := tf -Fl( x) 4- 0.5 -g(x)T Л -k g(x) 4 0_5tf -yT (Л -1) AZ Fp(x) = 131.79
F(XI= 019947
'l.SOOli
' ■ ' I 1.3994 J
s(x) = - -3J6№ 1
V 1-32456x 10 dJ
Итерации 2
С lajjix)^ ^ УВ И-уд
уц .= т^И.уц----^ kjj jj .= kr - km» Л^ .= —
jj := Ii if 5(х)д 4 AZjj > Ci I 0 otherwise
f 300
1.93634/ " 1,039737, 1.3153: x 10"'j1
V 0 3011
FL.X; := Fix)+уТЛ.5(х) Fgjx) := kf Fl(x)+0J5-e(x)T \ k g(x) 4-025-kf-yt-l Л-l) HZ. Fp(x) = 0j0026 xo := x
"1.30003л:
X := NM\xD.n.i .а.р.т.Ё .Fp; = : ' ^ '002 >
F(X'= 0.19999 i(x) =
1.3 10705*10 - j
3.1070S* 1С"
Итерация 3
yjj .= aux[ 0,yjj +-—- kjj := M + кшш AZjj .= -
IJ
kf ,
Jijijj - 11 if e(x)]j + AZjj > с
10 otherwise
. poo о ) о > дг=;' 0 1
L Й этуиччм L У 1-й I 1 * TO J
v v jvivjjj и j V ii 'ti v - - - ^ ^ -
Ft X; := Их) ty'ijxl FpjX; := kf Fl(x)+0J5-e(x)T Ч к e(x) + 0J5-kf y^A-l) AZ Fp(x) = 0.2 xC := X
F(x)= (U0001
, , ! 1.7Щ52Л
x nmixo.n.i .а.р.т.е .fp1 = :
..........1.139993)
^-3.71168x10 J
dl<- —-'V11- 1-n - 1,'
n-V3
l'
iV.о
for ie 1.. n fur ] e :..n- 1 "Xy <-di + iOi if j = i- 1
X^ j + l0{ Dth&r.'.'ISE
£n<- 1 - £ Itr- С
^ Fm > L^ 1
a a - 1 h<- 1
for i e 2;_ n - 1
Li- i ifFpix^^Fpl^i .'Fpix^liFpi^)
1 ; ^ x(i> i _ x'i>
aFp(xW))_<Fp(x{Ü)
^ X<V2) + Г) (И<УЗ> _ Х<У2>)
^ xi«4> if Fp|x<V4>) < Fp(xiL>)
х<ь) ^ XW3) otWi3E
if Fptx^liFpU®)
otherwise
^»+5) j^lttl) _ (, (х{Ь)_х<гн2) |
far i E 1.. ii - 1 a Fp(x<:°"; i > FpU<lCl)
Х<Ю ^ x<„5) oliennse
(fpH-FPMF
X<Li
Рис. 4. Результат расчета в программе MathCAD
Рис. 5. Подпрограмма NM (метод деформируемого многогранника)
Поскольку F(X) зависит от двух переменных, в начале поиска используется многоугольник с тремя вершинами.
Начальные значения варьируемых переменных: X = 2,5, X2 = 1,2 . Параметры задачи: ^ = 300; AZmax = 0,2; kf = 1. Приведем результаты расчета после трех итераций алгоритма:
F(X) min = 0,20001 в точке X [1,79982; 1,39993].
Активным при этом является ограничение g2. Порядок этого ограничения (10-5) отражает точность полученного решения.
Выполним решение этой же задачи, внутреннюю задачу минимизации функции Fp будем решать стандартной функцией MathCAD Minimize
/(х) при тех же начальных значениях X. На рис. 6 показана последняя итерация этого алгоритма.
Рис. 7. Зависимость значения функций от изменения x1 при различных km
Рис. 6. Результат расчета со стандартной функцией MathCAD МпМ/е/(х)
Значение целевой функции в этих подходах не дает отличий. Невязка ограничений имеет один и тот же порядок.
Иследования влияния коэффициента ктт на сходимость алгоритма
Для обеспечения надёжной работы алгоритма было отслежено влияние параметра ктт, входящего в штрафной коэффициент, на сходимость. Отметим, что эффективность функции ¥р определяется её выпуклостью по переменным варьирования X (рис. 7), которая обеспечивалась соответствующим значением параметров этих функций, таких как коэффициент штрафа. При некоторых величинах этого коэффициента функция не обладает достаточной выпуклостью в области оптимума, что сказывается на сходимости алгоритма.
На рис. 8 показаны значения целевой функции на итерациях при различных значениях параметра кт„, входящего в выражение коэффициента штрафа. Были приняты 4 значения ктп 10; 100; 200; 300. В табл. 1 даны результаты расчета тестового примера при различных значениях ктп.
Т а б л и ц а 1
Значения целевой функции при различных кт,„
Рис. 8. Изменение значения целевой функции на итерациях при различных ктп
Заключение
1. Из рассмотренного примера видно, что метод деформируемого многогранника даёт быструю сходимость при высокой степени точности в невязках ограничений.
2. Сравнение алгоритма поиска минимума функции методом деформируемого многогранника со стандартной функцией MathCAD Мinimize f(x)
kmin X F(X) g(X) max Число итераций
Xi X2
10 1,79983 1,39996 0,20004 -1,03155x10"4 5
100 1,79988 1,39992 0,19999 3,31182x10-5 5
200 1,79970 1,39984 0,19999 1,82815x10-5 4
300 1,79982 1,3993 0,20001 -3,71168x10-5 3
показывает сопоставимые результаты (рис. 4 и 6).
3. Для обеспечения удовлетворительной сходимости алгоритма необходимо задавать высокое значение параметра кти, входящего в штрафной коэффициент. Очевидно, что повышение этого параметра до определенного предела увеличивает скорость сходимости. Таким образом мы можем регулировать выпуклость модифицированной функции Лагранжа ^ по переменным X.
БИБЛИОГРАФИЧЕСКИЙ СПИСОК
1. Химмельблау Д. Прикладное нелинейное программирование. М., 1975.
2. Банди Б. Методы Оптимизации. Вводный курс. М. : Радио и связь, 1988._
3. Nelder-Mead algorithm [Electronic resource] // Schol-arpedia. URL: http://www.scholarpedia.org/article/Nelder-Mead_algorithm. (access date: 12.03.2012).
4. Хайруллин В. Р. Методические указания к лабора-торно-практическим работам по методам оптимизации. Казань, 2013. 63 с.
5. Дмитриева Т.Л., Безделев В.В. Использование мно-гометодной стратегии оптимизации в проектировании строительных конструкций // Изв. вузов. Строительство. 2010. № 2. C. 90-95.
6. Дмитриева Т. Л. Параметрическая оптимизация в проектировании конструкций, подверженных статическому и динамическому воздействию. Иркутск : Изд-во ИрГТУ, 2010. 176 с.
УДК 629.114.2
Свитачев Анатолий Иванович,
д. т. н., профессор кафедры «Математика и информатика», Сибирский государственный технологический университет, тел. (8391) 227-87-81
ОЦЕНКА ДИНАМИЧЕСКИХ ПАРАМЕТРОВ И ХАРАКТЕРИСТИК ПО МАТЕМАТИЧЕСКИМ МОДЕЛЯМ МАШИННО-ТРАКТОРНЫХ АГРЕГАТОВ И ИХ ЭФФЕКТИВНОЕ ИСПОЛЬЗОВАНИЕ
A. I. Svitachev
ESTIMATION OF DYNAMIC PARAMETERS AND CHARACTERISTICS ON MATHEMATICAL MODELS OF MACHINE-TRACTOR AGGREGATES AND THEIR EFFECTIVE USE
Аннотация. В работе рассматриваются основные динамические параметры и характеристики и методы их нахождения по математическим моделям машинно-тракторных агрегатов. Рассматривается оценка процессов динамики элементов силовой передачи при основных серийных возмущающих воздействиях. На основе проведенного анализа современных исследований динамические составляющие, определяющие нагруженность силовой передачи гусеничного трактора, можно разделить на четыре группы по источникам воздействий: воздействия от технологического сопротивления, от микропрофиля, от пространственных колебаний трактора на подвеске, от навесных и агрегатируемых орудий; от гусеничного движителя в зависимости от шага гусеницы и быстроходности трактора; от гармонических составляющих крутящего момента двигателя; от редукторной части трансмиссии и неравномерности вращения кардана. Выявлено процентное содержание составляющих групп в общей динамической нагруженности силовой передачи по данным большинства исследователей.
Разработанные методы вычисления параметров и характеристик позволяют более полно и эффективно использовать математические модели машинно-тракторных агрегатов для анализа их динамических свойств.
Определен перечень основных динамических параметров и характеристик и методы их нахождения, исходя из математических моделей динамики МТА на основе современных компьютерных технологий системы MathCad, с целью более полного и эффективного анализа динамических свойств.
Ключевые слова: моделирование, машинно-тракторный агрегат, динамические характеристики.
Abstract. In the work, the key dynamic parameters and characteristics methods of their stay on mathematical models of machine and tractor units are considered. The assessment ofprocesses of dynamics of elements of a power transmission is considered at the main serial revolting influences. On the basis of the spent analysis of modern probes the dynamic components defining stress loading of a power transmission of the crawler tractor can be devided into four groups on radiants of affectings: affectings from technological resistance, from a microprofile, from the space oscillations of a tractor on a suspender, from hinged and ganged up tools; from a caterpillar locomotor depending on a pitch of a caterpillar and rapidity of a tractor; from wave constituents of a twisting moment of the propeller; from a geared part of transmission and nonuniformity of twirl of a cardan. Percentage of every group in general dynamic stress loading a power transmission according to the majority of contributors is determined.
The developed methods ofparameters and characteristics calculation allow to use mathematical models of machine and tractor units for the analysis of their dynamic properties better and more effectively.
Keywords: modeling, machine and tractor unit, dynamic characteristics.
Анализ работ и опыт исследований показывает, что машинный агрегат представляют в виде системы масс, соединенных упругими и фрикционными связями, с действующими на нее возмущающими силами. В работе [1, с. 22] представлена справка в виде таблицы по истории изучения во-
проса моделирования динамики машинно-тракторных агрегатов (МТА). Дополнив приведенные данные исследованиями за последние годы рядом работ [2, с. 11, 3, с. 93, 5, с. 153, 6, с. 36, 7, с. 133, 8, с. 54 и др.], можно сделать вывод, что построенные математические модели по многомас-