ОБ ОСОБЕННОСТЯХ ПРЕПОДАВАНИЯ ДИСЦИПЛИН МАТЕМАТИЧЕСКОГО ЦИКЛА В РЯДОВЫХ ТЕХНИЧЕСКИХ ВУЗАХ (НА ПРИМЕРЕ ДИСЦИПЛИНЫ «МЕТОДЫ ОПТИМИЗАЦИИ»)
Е.Г. Крушель, к.т.н., проф., проф. каф. Автоматизированых систем обработки информации и управления Тел.: (84457) 2-63-55; E-mail: [email protected] Д. В. Медведев, асп. ВолгГТУ, преп. каф. Информатики Тел.: (84457) 9-40-48; E-mail: [email protected] Камышинский технологический институт (филиал) Волгоградский государственный технический университет (ВолгГТУ)
http://www.kti.ru
The considered technique is directed to the mathematics study role increase in the engineering experience formation, the applicable aspects of mathematical methods deepening, and the technical colleges students' mathematical training activity raising. The main positions are illustrated by the gradient optimization methods study scheme.
Введение
Изучение дисциплин математического цикла имеет в рядовых технических вузах особенности, связанные с прагматичностью студентов бакалавриата, осознающих, что большинство выпускников будет занято в сфере эксплуатации и, возможно, в сферах наладки и усовершенствования действующих систем (но не в сферах науки, проектирования и преподавания). Поэтому предметы математического цикла воспринимаются основным потоком студентов не как школа инженерного (аналитического) мышления и источник идей для инновационных проектов, а только как оторванный от целей будущей профессиональной деятельности «фильтр», который студенты обязаны пройти для перехода на старшие курсы.
Сложности преподавания наукоемких дисциплин, скорее всего, усугубятся после внедрения мероприятий по реформе высшего образования, согласно которой рядовые технические вузы будут осуществлять узкопрофильную подготовку специалистов. Возникает опасность получить поколение выпускников со сниженными способностями к творческой инженерной деятельности.
Мы думаем, что можно частично блокировать неизбежные отрицательные последствия изменения технологии подготовки
инженеров, если «нагрузить» дисциплины математического цикла, во-первых, содержательными примерами решения задач, постановки которых заимствуются из области профессиональной деятельности выпускников бакалавриата, и, во-вторых, методическими приемами преподавания, которые содействуют процессу формирования инженерного мышления.
Первый аспект может быть реализован за счет углубления сотрудничества между преподавателями математических дисциплин, с одной стороны, и преподавателями общетехнических и специальных дисциплин, с другой стороны, т.е. за счет усиления междисциплинарных связей.
Второй аспект в существующих учебниках и пособиях по математическим дисциплинам для технических вузов почти не учитывается. Постановки задач и методы решения излагаются как данность, т. е. без пояснения логической цепи, согласно которой автор ограничился именно такой постановкой задачи и предложил именно такую систему лемм и теорем для решения. Этот стиль формирует у студентов вредное отношение к теоретическим основам наукоемких специальных дисциплин как к некоторой элитарной сфере, участие в развитии которой для них недоступно.
По-видимому, для дисциплин математического цикла полезно отказаться от предопределенности постановки задачи и метода ее решения и перейти к схеме, содействующей формированию специфического инженерного мышления: от конечной цели, сформулированной на содержательном уровне, - через процедуру анализа причин, препятствующих ее достижению, - к нахождению (иногда - изобретению нового) способа ее достижения - и затем к расширению состава прикладных задач, в которых разработанный способ дает возможность найти решение. Эта схема создает в студенческой аудитории обстановку, в которой изучаемые методы воспринимаются не как данность, а как результат «соучастия» студентов в творческом процессе, пройденном автором рассматриваемого метода.
Статья иллюстрирует отдельные элементы этой схемы на примере дисциплины «Методы оптимизации», включенной в учебные планы многих направлений подготовки бакалавров техники и технологии в составе блока «Математика». Многолетний опыт преподавания этой дисциплины в Ка-мышинском технологическом институте (филиале) Волгоградского государственного технического университета (КТИ ВолгГТУ, подготовка бакалавров по направлению «Информатика и вычислительная техника» и инженеров по специальности «Автоматизированные системы обработки информации и управления») показывает, что рассматриваемые методические приемы повышают интерес студентов к предмету и содействует активному освоению существующих мощных средств их научной и методической поддержки, например [1..4].
Обзор содержания статьи
Рассматривается один из примеров, входящий в состав разработанного в КТИ ВолгГТУ методического сопровождения дисциплины «Методы оптимизации» [5.. 8]. Изложение этой дисциплины построено так, чтобы показать студентам технического вуза, что между общетеоретическими (математическими) методами и конкретной прикладной задачей часто имеется разрыв, для преодоления которого необходима самостоятельная творческая работа инженера — разработчика прикладной задачи.
Рассматриваемый пример относится к разделам дисциплины, в которых изучаются градиентные методы нахождения экстремума скалярной функции векторного аргумента как при отсутствии, так и при наличии ог-
раничений. Фрагмент семестровой работы по данным разделам и сценарии практических занятий содержат следующие позиции:
1. Описывается постановка одной из прикладных задач, с которой сталкивается инженер - разработчик автоматизированной системы управления, - определение экономически целесообразной степени автоматизации производственного процесса. Сценарий примера связан с дисциплиной «Проектирование автоматизированных систем обработки информации и управления», которую студентам предстоит осваивать на старших курсах.
2. Проводится анализ возможностей формализации задачи в терминах определения оптимального размера фирмы [9]. Выявляется один из этапов решения, состоящий в построении производственной функции предприятия [9] по отчетным данным о его работе.
3. Рассматривается постановка задачи параметрической идентификации для одной из известных производственных функций (ПФ) - ПФ Кобба-Дугласа [9]. Выявляются методы теории оптимизации, которые могут быть привлечены для ее решения.
4. Студентам предлагается попытаться решить задачу выявленными методами. Исходные данные специально подобраны так, чтобы эти попытки оказались неудачными.
5. На практическом занятии создается обстановка, способствующая выявлению причин неудачи. На основе их анализа студенты предлагают способы «приспособления» теоретического метода к конкретной прикладной задаче. В результате студенты с помощью преподавателя «изобретают» прием, основанный на масштабировании искомых переменных. Этот прием позволяет найти решение.
6. Рассматривается более сложная прикладная задача (элемент алгоритмического обеспечения автоматизированной системы управления) - планирование объемных показателей тепличного хозяйства (расчет размеров отводимой площади и экономически целесообразной цены для каждой культуры). Проводится формализация этой задачи в терминах нелинейного математического программирования с нелинейным критерием и нелинейной системой ограничений.
7. Попытка решить задачу с помощью одного из самых распространенных методов нелинейного математического программирования (метода штрафных функций) оказывается неудачной. Но прием масштабиро-
вания, «изобретенный» студентами для более простой задачи, ведет к успеху. Это замыкает цепь рассуждений [зачем?— почему? — как? — где еще использовать?], которую мы хотели бы привить будущим инженерам.
Ниже приведены комментарии к этим позициям.
Комментарии к позициям 1..3
Задача определения экономически целесообразной степени автоматизации производственного процесса состоит в оценке соотношения между стоимостью основных фондов контура автоматизированного управления К и стоимостью контура ручного труда Ь, при которых прибыль предприятия максимальна. Эта задача распадается на следующие подзадачи:
1. Разработка моделей зависимости дохода и затрат предприятия от К, Ь (т.е. производственной функции) по экспериментальным данным.
2. Определение значений К*, Ь*, при которых достигается максимум разности между доходом и затратами (данная задача является частным случаем общей задачи определения оптимального размера фирмы [9]).
Применение методов нахождения экстремума скалярной функции векторного аргумента для решения второй подзадачи не вызывает затруднений (эту подзадачу преподаватель может использовать как пример практического приложения методов оптимизации).
Полезность использования этих же методов для решения первой подзадачи иллюстрируется на примере оценки параметров модели производственной функции, форма которой задана. Из числа известных выбрана модель Кобба-Дугласа (не только из-за ее популярности, но и потому, что при попытках параметрической идентификации студенты увидят, что очевидный - на первый взгляд - путь решения не всегда ведет к успеху).
Задача идентификации формулируется традиционно [10]:
По отчетным данным предприятия об N значениях стоимости основных фондов К и фонда оплаты труда Ьь /=1,..^ найти
оценки А, —, в неизвестных параметров
А, а, в производственной функции Кобба-
Дугласа У (К, Ь, А, а, в):
У(К, Ь, А, а, в) = А-Ка-Ьв.
(1)
Предполагается, что отчетные данные (тройки КI, Ц, У], / = 1,.., N) могут сопровождаться аддитивными случайными нормально распределенными погрешностями с нулевым математическим ожиданием и известной дисперсией; взаимная корреляция между погрешностями и статистическая связь погрешностей с переменными К и Ь отсутствует.
На первый взгляд, задача может быть решена известными методами параметрической идентификации [10]: оценки
А*,а*,в * неизвестных параметров А, а ,
Р должны доставлять минимум критерию, построенному на выпуклой функции (далее - квадратичной) отклонений расчетов по модели (1) от фактических значений производственной функции
(А*,а*,в*) = аг^шт 3(А,а,в), (2)
А —,в
_ _ 1 N _ — — где 3(Ав) = -• X(У — АК— ■Ь1в )2 .
N I=1
Внешне (2) является типичной задачей определения минимума скалярной функции
3(А, а, в ) по аргументам (А, а, в ) .
Комментарии к позиции 4
Вначале студентам предлагается решить задачу одним из изученных методов поиска экстремума 1-го порядка [1] - например, методом наискорейшего спуска или алгоритмами с постоянным либо переменным шагом, длина которого не зависит от формы минимизируемой функции. Они убеждаются, что ни один из методов не позволяет идентифицировать один из параметров (А), хотя остальные параметры (а, в) оцениваются с высокой точностью (рис. 1).
При использовании алгоритмов 2-го порядка выясняется, что идентификация может оказаться успешной (рис. 2), но успех зависит от выбора начального приближения: имеются варианты, при которых итеративный процесс является расходящимся (рис. 3).
Комментарии к позиции 5
Обнаруженное «расхождение» между рекомендациями теории и попыткой их использования на практике кажется студентам удивительным и вовлекает их в процесс осмысливания ряда «творческих» вопросов -например:
— Почему при использовании градиентных методов 1-го порядка часть параметров оценивается правильно, а одна из оценок
(Лу) остается неизменной в течение всего итерационного процесса
- (Л0,у = 0,1,...,утах)?
— Почему метод 2-го порядка (в отличие от методов 1-го порядка) позволяет (при
удачно выбранном начальном приближении) найти оценку параметра Л?
- Почему от выбора начальных условий зависит факт сходимости метода 2-го порядка?
1.5
я
к
11-2 I С й-Н
я
£ 0.3+ к О
/
эоГ
30 40
к и 1
к"8 4) Ы )■) 1
К И *
Ш
| О И.б
5о5
!ч
А-
/
1 0 20 3 0 Л 0 5
Номер итерации V
Номер итерации V
Рис. 1. Процесс идентификации в ходе итераций V = 0,...,-тах градиентного метода с переменным шагом. Слева: иллюстрация удовлетворительной сходимости оценки (3-у, к параметру в; характер сходимости оценки ау к параметру а аналогичен. Справа: иллюстрация отсутствия
сходимости оценки Лу к параметру А
Рис. 2. Удовлетворительная сходимость оценок Л-,а-,ву к параметрам Л,а,в в ходе итераций V = 0,...,-тах метода Ньютона
«
и
03
-0.4
I а-1.6
к _
18 и
-5- ч
а.
-V
Ту
0 о зо: 0 40 Г
| о.®
|-0.4
1^-1 6 я
I -5.Е
-А
\ V —
к
а
40
-20
-30 140
0 10 20 30 40 50
О "200
А
Л
0 10 20 30 40 5
Номер итерации V Номер итерации т Номер итерации V
Рис. 3. Расходящийся процесс изменения оценок Лу, ау, вУ к параметрам Л, а, в в ходе итераций V = 0,...,—тах метода Ньютона
На практическом занятии возникает активная студенческая дискуссия по этим вопросам с критикой общетеоретических методов и с высказыванием большого числа
идей-«поправок». Несмотря на то, что большинство идей неверно, дискуссия оказывается очень продуктивной, поскольку постепенно приводит студентов к убеждению о
необходимости детального рассмотрения особенностей постановки задачи (на этой фазе занятия воспитываются элементы убеждения, необходимого инженеру-системотехнику: удачная система управления не может быть создана, если разработчик знаком с технологическими особенностями объекта только поверхностно).
Для понимания особенностей задачи, обнаружения препятствий к решению и нахождения способов, ведущих к успеху, полезны графические средства, которые легко воспринимаются студентами с недостаточной математической подготовкой. Пример графического представления сечений поверхности критерия (3) показан на рис. 4; в нижней части рисунка показаны проекции линий равного уровня на координатные плоскости.
Рис. 4а поясняет возможность правильного оценивания параметров — , в, при заданном значении оценки А параметра А, несмотря на наличие глубокого оврага (ось симметрии проекций линий равного уровня расположена под углом к координатным осям). Рис. 4б поясняет отсутствие сходимости оценки А параметра А: проекции линий равного уровня параллельны координатной оси А , поэтому значения минимума критерия (3) одинаковы для любого значения
А (при этом оценки а, в параметров а, в находятся правильно). Рис. 4в иллюстрирует причину влияния начального приближения на факт наличия/отсутствия сходимости оценки параметров градиентным методом 2-го порядка: обнаруживается область значений аргументов, в которой критерий не является выпуклым.
Поскольку графическая интерпретация трудоемка, легко ввести стимулы к использованию математических критериев и методов, позволяющих провести анализ особенностей задачи гораздо быстрее.
Понимание задачи постепенно приводит студентов к «изобретению» приема решения, в котором параметр А, препятствующий сходимости, может быть исключен. Существо приема состоит в переходе к масштабированным переменным
Кт =_К, ьт =_£, ут , (4)
Km
Lm
Ym
Kmax = max(K ), Lmax = max(L(), Ymax = i i
= max(Y)-
i
Этот прием позволяет перейти от задачи (2) оценивания трех параметров к двумерной задаче, не содержащей оценки A :
(а*,в*) = argmin Jm(а,в),
а в
где
1 N
(5)
Jm(a,e) = -(Km)a-(Lm)e)2 . (6)
N i=1
«Недостающая» оценка A * вычисляется после нахождения а*, в * :
A* = -
Y
max
K а*г в*
max max
(7)
где
Студенты обнаруживают, что при наличии погрешностей в исходных данных оценки параметров являются смещенными (величина смещения незначительна и уменьшается при увеличении числа N ). В дискуссии выявляются причины смещения и меры по его уменьшению (исходные данные должны быть такими, чтобы паре (Кшах, Ьшах) соответствовало значение Ушах).
Иллюстрация полезности приема масштабирования приведена на рис. 4г: поверхность критерия не имеет оврага, в результате чего градиентные алгоритмы сходятся с высокой скоростью (рис. 5).
Намеренно усложненный путь решения задачи (неудача - анализ причин - успех) позволяет преподавателю не только показать студентам частный, но полезный прием (масштабирование исходных данных и приведение их к безразмерной форме), но и, во-первых, проиллюстрировать трудности, которые возникают у инженеров при решении прикладных задач, и, во-вторых, продемонстрировать полезность теоретических методов анализа особенностей прикладной задачи.
Комментарии к позиции 6
Полученные знания закрепляются на практических занятиях при решении гораздо более сложной задачи оптимизации (с нелинейным критерием и нелинейной системой ограничений). Изложение (аналогично позиции 1) начинается с рассмотрения постановки прикладной задачи оптимального оперативного планирования для тепличного хозяйства: найти значения векторов S и Ц, компонентами которых являются размеры
площадей 8/ > 0 и цены Ц1 для каждой 1-й
культуры, выращиваемой в теплицах хозяйства, 1= 1,...,т; число т культур и их перечень заданы. Значения 8 и Ц должны обеспечить достижение максимальной прибыли
(8 *, Ц *) = а^ шах Р(8, Ц), (8)
8, Ц
т
где Р(8, Ц) = [ X (Ц1 — С >щ 81 ] — 7 . (9) /=1
. Графические иллюстрации особенностей задачи идентификации Рис. 4. Графические иллюстрации особенностей задачи идентификации
*
ж и
Я"
3
4
□.53' □ 49 О 45
кПГкГ
] ц
0 й 1 9 >А з
| в.^В и
0 0.36
1
- а. 24
X
I
а
0 !2-
У
-
0 6 з : ь и :
Номер итерач н н V н^меР итерщ к н ^
Рис. 5. Процесс оценивания параметров а, в в задаче с масштабированием переменных (градиентный метод с переменным шагом, не зависящим от формы функции)
В (9) заданы: С и1, 7 - себестоимость
единицы готовой продукции 1-й культуры, урожайность 1-й культуры и условно-постоянные расходы.
Критерий (8) содержит произведения искомых переменных (Цг-8г) и является невыпуклым. В отличие от задачи (2)-(3) рассматриваемая оптимизационная задача должна быть решена в условиях ограничений:
1. Линейное ограничение по заданной
суммарной площади 8 :
т _
X 8 < 8. (10)
1=1
2. Нелинейные ограничения по спросу на каждую культуру (в зависимости от ее цены; форма зависимости задана):
щ 8 < Ь (Ц,) V/ = 1,...,т . (11)
3. Ограничения по минимальной и (возможно) максимальной рентабельности
каждой культуры:
Сг < Ц, <уг -Сг V/ = 1,..., т,.
(12)
где V, - заданный норматив допустимого превышения цены над себестоимостью.
Комментарии к позиции 7
После обсуждения постановки задачи студентам предлагается попытаться осмыслить трудности, которые встретит инженер, использующий теоретический результат при решении конкретной прикладной задачи, при определении размера площади и цены единственной культуры, т =1 (упрощение вводится для того, чтобы ввести поясняющую графическую интерпретацию). Ниже при описании сценария индекс культуры 1 не используется (поскольку культура - единственная). Цель расчета - определить площадь 8 и назначить цену Ц, обеспечивающую получение максимальной прибыли Р(8,Ц).
Нелинейная функция зависимости
спроса на продукцию от цены в (11) имитируется зависимостью
f (Ц) = а - Ь-Ц
7
(13)
причем параметры а, Ь подобраны так, чтобы при увеличении цены спрос сначала изменялся незначительно, а затем быстро уменьшался до нуля (график показан на рис.6).
В индивидуальных заданиях к семестровой работе указывается метод решения (один из изученных студентами методов нелинейного математического программирования) и исходные данные, которые намеренно предоставляются преподавателем в форме, затрудняющей решение (например, за счет введения «неудачных» размерностей: в кг/м2 для урожайности и, в р./(цикл возделывания) для составляющих себестоимости, в р./кг за цены и в тыс.м2 для площадей; при этом искомые величины будут различаться на 2 порядка).
Проиллюстрируем сценарий семестрового задания, в котором для решения задачи используется один из популярных методов нелинейной оптимизации - метод внешних штрафных функций [2]. Существо метода применительно к данной задаче:
1. Каждое ]-е ограничение, которому должно удовлетворять решение, записывается в форме
gj 0?, Ц ) < 0. (14)
В рассматриваемой задаче 7=1,.. .,6: g1(S, Ц) = и? - а + ЬЦ7 < 0 - ограничение по спросу согласно (11),
g2(?, Ц) = Ц - уС < 0
(13);
- ограничение на максимально допустимую цену;
g3(S,Ц) = -S < 0 dJ (S, Ц)
St+1 = St -at •[-
- требование неотрицательности значения площади S;
g4(S, Ц) = - Ц+C < 0
- требование превышения цены над себестоимостью C;
g5(S,Ц) = S - S < 0
- площадь S не должна превышать доступную S ;
g6(S, Ц) = -(Ц - C)-u-S + Z < 0
- условие неотрицательности прибыли.
2. Для каждого из ограничений вводится функция срезки, не равная нулю только в области значений переменных (S, Ц), при которых ограничение не выполняется:
+ Jg, (S, Ц), еслщ, (S, Ц) > 0 g ( 'Ц 10, еслщг(S,Ц)<0' . (15) i = 1,...6
3. Вводится вспомогательный критерий J (S, Ц ) , подлежащий минимизации; в него входят исходный критерий (2) и штрафы за нарушение ограничений:
J{StU) = -P(S, Ц) +D , (16)
j=1
где P(S, Ц) = (Ц - C)-u-S - Z (исходный критерий - прибыль); q - параметр гладкости штрафа, q >1; D - коэффициент, учитывающий «вес» штрафов за нарушение ограничений в критерии (15); n - число ограничений (в данном примере n = 6).
4. Решение задачи
(S*, Ц*) = arg max P(S, Ц) при наличии (S, Ц)
ограничений (14) может быть найдено при использовании итеративной процедуры безусловной минимизации (16):
Ц+1 = Ц -at[
dS J (S, Ц)
+ Dt q I{[g7+(S, Ц)]-1-™
S=St, Ц=Ц
дЦ
j=1 6
dS
S=St ,Ц=Ц
+ Dtq Z {g+(S,Ц)Г1JSS
дЦ
(17)
],
S=St ,Ц=Ц
,ц=ц 7=
где ( = 0,1,. - номер итерации; стартовая точка (?0,Ц0) задана произвольно вне области выполнения ограничений (14); а, В, q - параметры, обеспечивающие сходимость итерационной процедуры, q> 1.
5. При удачном выборе изменений параметров а, А в ходе итераций обеспечи-
вается сходимость итерационной процедуры
минимизации без ограничений к искомому оптимальному решению задачи с ограниче-
ниями (14), т.е. St ^ S*, Цг ^ Ц * при t . Условие выбора параметров at, Dt:
lim Dt ^ да, lim at ■Dt ^ 0 (например, at
t t
а г~
= —, = d• V t, где — и ^ выбираются при
настройке алгоритма).
До этой позиции включительно понимание алгоритма не вызывает трудностей; но затем студенты обнаруживают, что при использовании исходных данных в форме, приведенной в задании, решение найти не удается. Первый шаг - использование приема масштабирования исходных данных -студенты легко находят самостоятельно (благодаря изученному ранее, см. позицию 5); но и после этого решение найти не удается.
На рис. 6 показан типичный пример неправильного определения оптимума: из точки 0 начального приближения (согласно положениям метода штрафных функций эта точка может быть задана произвольно, что не подтверждается при попытках решения задачи) итерационный процесс (17) приводит к выходу на нелинейное ограничение (точка 1) и останавливается. Найденная точка удовлетворяет единственному ограничению (истинный оптимум - в точке 3, на границе допустимой области, определяемой верхней границей цены и доступной площадью). Сочетание аргументов (8,Ц) в точке 1 не только не удовлетворяет всем ограничениям (14), но и обеспечивает меньшее зна-
чение критерия (9), чем в точке 3 истинного оптимума. Если бы ограничения по цене и по доступной площади отсутствовали, алгоритм должен был бы найти точку 2 (в которой линия ограничения по спросу и проекция одной из линий равного уровня критерия имеют общую нормаль). Но и эту точку алгоритм не находит. Очевидная мера - увеличение числа итераций - также не приводит к успеху.
Возникают вопросы, вовлекающие студентов в обсуждение проблем перехода от математического результата к прикладному.
1. Почему возникает преждевременная остановка алгоритма в точке, не соответствующей допустимой области, и почему эффект преждевременной остановки не удается устранить при увеличении числа итераций
(17)?
2. Почему при некоторых сочетаниях исходных данных итерационный процесс (17) становится расходящимся?
3. Если получено сочетание аргументов, удовлетворяющее всем ограничениям, то как проверить - соответствует ли это сочетание оптимуму критерия (9)?
4. Каким образом выбрать параметры — и d в методе штрафных функций, если априорно неизвестен даже порядок их величин?
Рис. 6. Эффект отсутствия сходимости поиска оптимума методом штрафных функций
Обсуждение этих вопросов подводит удобных физических размерностей для ис-
студентов к более глубокому пониманию ходных данных, но и для устранения разно-
приема масштабирования: введение масшта- масштабности при проверке выполнения ог-
бов полезно не только для установления раничений и при вычислении градиента
V 3 (8, Ц) =
3(8, Ц) д3 (8, Ц)
58
дЦ
т
Функции срезки (15) заменяются масштабированными:
' gi (Б, Ц)
Ёг + ( ?, Ц ) =
г, если (Б, Ц ) > 0
\Ёг (?, Ц )|
0, если (Б, Ц ) < 0
В алгоритм (17) вводится масштабирование градиента:
г = 1,...,6 .
(18)
+1 = -а1'
д/ (Б, Ц)
Ц (+1 = Ц ( -а -[
дБ дЗ(Б,Ц)
+ Д
Б=, Ц = Ц |
{[ Ё, + (Б, Ц -
дЦ
6
•q• Е
,=1
+ Д1 •q• Е{[ ё,+(Б, Ц -1 .
д/ (Б, Ц)
дБ
д/ (Б, Ц)
Б=, Ц = ЦI
(19)
Б, Ц =Ц 7=1
После этого легко удается получить сходящийся алгоритм (рис. 7), иллюстрирующий правильную работу метода штрафных функций: из точки 0 начального приближения - в точку 1, в которой выполняется одно из ограничений (по максимальному значению цены); затем часть траектории «скользит» по этому ограничению (участок между точками 1 и 2). Далее активным становится ограничение по спросу, и в течение ряда итераций алгоритм «отслеживает» его выполнение (между точками 3 и 4). В точке
дЦ
дЦ
Б=Б!, Ц = ЦI
3 активным становится снова ограничение по уровню цены (участок между точками 4 и 5*). В точке 5* выполнены все ограничения; поскольку по форме проекций линий равного уровня критерия (9) видно, что оптимум обязательно лежит на границе допустимой области, 5* является точкой оптимального сочетания параметров (Б*,Ц*). Если бы ограничения по доступной площади и по цене не оказались лимитирующими, алгоритм «нашел» бы точку 6.
Рис. 7. Характерная траектория поиска оптимума при использовании метода штрафных функций с введением масштабирования ограничений и градиента
Способы, позволяющие автоматически определять параметры в алгоритме штрафных функций, обсуждаются вне сетки аудиторных и самостоятельных занятий (на семинаре, в котором участвуют только студенты, проявляющие интерес к научной работе). Преподаватель, ведущий семинар, предоставляет студентам возможность раз-
работки таких способов самостоятельно. Попутно преподаватель знакомит студентов с общенаучными приемами, которые могут привести к получению нового научного результата: Прием, основанный на аналогиях: преподаватель предлагает студентам найти аналогию между алгоритмом (19) и алгоритмами оптимизации при отсутствии огра-
}
ничений, изученными студентами ранее. В дискуссии студенты обнаруживают аналогию с алгоритмом градиентной оптимизации с переменным (уменьшающимся в ходе итераций) шагом, не зависящим от формы минимизируемой функции. На основе этой аналогии естественно предположить, что успех поиска экстремума определяется, в основном, удачным выбором параметра — (т.е. вида зависимости от номера итерации и параметров этой зависимости).
Прием, основанный на поиске простейшего варианта из возможных (согласно «бритве Оккама»): простейшей формой зависимости параметра — от номера итера-1
ции г является аг =-, в которую входит
' к ■ г
единственный параметр к, подлежащий автоматической настройке в ходе работы алгоритма. После такого выбора легко выбрать (исходя из условия сходимости алгоритма штрафных функций) простейшую форму зависимости параметра Dt от номера итера-
ции: = d■ \г , 1 < т < 2 с параметрами
d и т, подлежащими самонастройке (в данном случае взяты за основу рекомендованные в [2] формулы).
Предположение о недостатках алгоритма (19): как и в алгоритме с переменным шагом, не зависящим от формы минимизируемой функции, можно ожидать появление нежелательного эффекта преждевременной остановки алгоритма, если значение — на некоторой г*-й итерации станет равным нулю (с точностью до разрядности машинного слова) вне точки оптимума.
Предположение о способе преодоления недостатка: как и в градиентных методах оптимизации без ограничений нужно придумать процедуру, в которой величина шага будет связана с формой минимизируемой функции.
Анализ отличий: в отличие от оптимизации без ограничений в алгоритме штрафных функций на каждом шаге используется взвешенная сумма градиентов критерия и ограничений с постепенным ослаблением вклада ограничений. Поэтому зависимость длины шага от формы функции естественно связать со значением градиента ограничений.
Гипотеза о способе введения механизма самонастройки алгоритма за счет ввода зависимости длины шага от формы штрафной функции: в отличие от «классического» алгоритма (в котором параметр d в формуле
для определения параметра Dt - константа) нужно связать значение d с длинами
(8г, Цг )| векторов-ограничений в текущей итерации. Простейшая форма этой зависимости: dt = 1/ ,
п
где Ь^ = Х (8г, Цг )|. Можно ожидать, 1=1
что параметры q и т не окажут существенного влияния на сходимость, и их значения можно выбрать согласно рекомендациям [2] - например, q = 2, т = 1.1.
Эффективность гипотезы: если данная гипотеза подтвердится, то значение коэффициента к в формуле для параметра — можно будет определить расчетным путем (это значение также получится зависящим от формы штрафной функции на данной итерации). Далее студенты вспоминают об эффективности масштабирования элементов алгоритма и с помощью преподавателя разрабатывают способ расчета коэффициента к. Пример схемы расчета:
1. Перед запуском процедуры рассчитывается
Р ^М80, Ц0)Т ^т (80, Ц0), 1 = 1,-, п, где п - количество ограничений-неравенств; VJn(8o, Ц0) - нормированный градиент критерия; Vgnj (80, Ц0) -нормированный градиент 1-го ограничения.
2. Если VJn(80, Ц0) * 0 и
Vgn^ (80, Ц0 ) * 0Vi = 1,..., п, то рассчитывается значение:
1 х Р
v=X рК
г 1, у=1,1 * у рр
п2
где г = Сп - количество слагаемых под
знаком суммы в формуле, равное количеству сочетаний из п элементов по 2.
3. Далее рассчитывается значение коэффициента к в формуле для параметра —
к =
(1 + V);
где А = VJn(8 0, Ц 0)Т
( п V
В = XVgni (80, Ц0)
и=1
XVgni(80,Ц0) ; -1=1 )
( п \
XVgni (80, Ц 0) 11=1
Гипотезы об усовершенствовании алгоритма штрафных функций проверяются и
уточняются в ходе вычислительных экспериментов. Пример траектории сходимости алгоритма внешних штрафных функций с самонастройкой параметров показан на рис. 8; качество сходимости оказалось выше, чем при трудоемком и длительном подборе/выборе параметров вручную (рис. 7).
В отличие от тестовых задач, рассмат-
Проекции линий равного уровня критерия (прибыли) I (тыс. р.)
риваемых на этапе исследования алгоритма, при решении практических оптимизационных задач значение оптимума заранее неизвестно; поэтому семинар заканчивается обсуждением вопроса о способах проверки достижения точки экстремума после окончания процесса сходимости.
Рис. 8. Траектория поиска оптимума при использовании метода штрафных функций с введением масштабирования ограничений и градиента с автоматическим расчетом коэффициентов а и Б
Заключение
Мы понимаем, что «вторжение» постановок практических задач, рассматриваемых в учебных дисциплинах общепрофессионального и специального циклов, в традиционные рабочие программы изучения математических дисциплин является спорным, поскольку вызывает необходимость большой дополнительной работы для существенного усиления междисциплинарных и межкафедральных связей.
Спорным является также тезис о целесообразности изменения стиля изложения математических дисциплин в рядовом техническом вузе (от конечной практической цели - через процедуру анализа причин, препятствующих ее достижению, - к нахождению способа ее достижения - и затем к расширению состава прикладных задач, в которых найденный способ дает возможность найти решение) по сравнению с традицией, привитой преподавателям кафедр высшей математики в классических университетах.
Но потребность в повышении эффективности изучения дисциплин математического цикла вызывается слабостью математической подготовки многих студентов
старших курсов, которая не только осложняет изучение наукоемких дисциплин общепрофессионального и специального циклов, но и, главное, препятствует формированию творческого инженерного мышления.
Проиллюстрированные в статье приемы были отработаны в Камышинском технологическом институте для одной из дисциплин математического цикла («Методы оптимизации»). Так сложилось, что преподавание этой дисциплины (в отличие от других математических дисциплин, порученных кафедре Высшей математики) вела выпускающая кафедра. Эта ситуация была вызвана кадровыми трудностями, является нетипичной и, естественно, не может быть одобрена. Но в результате формирование набора прикладных задач и изменение стиля изложения (по сравнению, например, с принятым в [1]) не вызвали затруднений и дополнительных затрат. Опыт изучения дисциплины и результаты тестирования остаточных знаний показали, что студенты воспринимают эту дисциплину с позиций потребности в будущей профессиональной деятельности. Это подтверждается также стабильным ростом числа выпускных и дипломных работ, в которых используются оптимизационные по-
становки.
В каждом техническом вузе, преподаватели которого обеспокоены низким уровнем математической подготовки студентов старших курсов, естественно, накоплен свой опыт повышения эффективности изучения наукоемких дисциплин. Возможно, журнал
сочтет целесообразным освещение этого опыта. Понимая, что обмен отработанными методическими приемами полезен, мы готовы предоставить методическое обеспечение дисциплины «Методы оптимизации» (запрос по адресу [email protected]).
Литература
1. Аттетков А.В., Галкин С.В., Зарубин В.С. Методы оптимизации: Учебник для студентов высших технических учебных заведений.- М.: Изд-во МГТУ им. Н.Э. Баумана, 2001. - 437 с.
2. Сухарев А.Г., Тимохов А.В., Федоров В.В. Курс методов оптимизации. Режим доступа: http://www.ergeal.ru.
3. Сборник задач и упражнений по высшей математике. Математическое программирование: Уч. пособие/Кузнецов А.В., Рутковский Р.А. (ред.). - Минск.: «Вышэйшая школа», 2002.- 448 с.
4. Аоки М. Введение в методы оптимизации. Основы и приложения нелинейного программирования. - М.: Наука, 1977. - 343 с.
5. Крушель Е.Г. Компьютерная поддержка учебной дисциплины «Методы оптимизации»: опыт обучения методам решения реальных оптимизационных задач//Математика Компьютер Образование: Сб. научн. тр., МОО «Женщины в науке и образовании». - М.- Ижевск, 2002. - Ч. 1. - С. 132-139.
6. Крушель Е.Г. Компьютеризация очного обучения: Рго&СоПга//Математическое обеспечение ЭВМ: Межвуз. сб. научн. тр. - Воронеж: ВГУ, 2002. - С. 82-89.
7. Крушель Е.Г. Компьютерная поддержка изучения методов оптимизации и управления в профессиональной подготовке инженеров-системотехников // Информационные технологии в образовании, технике и медицине: матер. междунар. конф., 23-26 октября 2006 г. - Волгоград: ВолгГТУ, РПК «Политехник», 2006. - С. 72-73.
8. Крушель Е.Г., Степанченко О.В. Синтез и моделирование цифровых управляющих систем с двойной шкалой времени.- М: Машиностроение-1, 2006. - 96 с.
9. Малыхин В.И. Математическое моделирование экономики: Учебн.-практич. пособие. - М.: Изд-во УРАО, 1998. - С. 28-39.
10. Методы классической и современной теории автоматического управления. - Т.1. Анализ и статистическая динамика систем автоматического управления: Учебник для студентов высших учебных заведений - Н.Д. Егупов (ред.). - М: Изд-во МГТУ им. Н.Э. Баумана, 2000.- С. 588-625.
11. Медведев Д.В. Выбор настраиваемых параметров в алгоритмах оптимизации, основанных на методе штрафных функций/Прогрессивные технологии в обучении и производстве: Матер. IV Всеросс. конф., г. Камышин, 2006г.: - В 4 т. - Волгоград, 2006. - Т. 2. - С. 139-143.
МОДЕЛЬ ЦЕЛЕВОГО РАСПРЕДЕЛЕНИЯ БЮДЖЕТНЫХ СРЕДСТВ РЕГИОНА И ЕЕ ИСПОЛЬЗОВАНИЕ В УЧЕБНОМ ПРОЦЕССЕ СИТУАЦИОННОГО ЦЕНТРА
М.А. Навроцкая, асп., вед. спец. Ситуационного центра Тел.: (495) 436-07-99; E-mail: [email protected] Т.Е. Сафонова, к.ф.-м.н., доц. каф. Информационных технологий в управлении Тел.: (495) 436-04-94; E-mail: [email protected] Российская академия государственной службы при Президенте Российской Федерации
http://www.rags.ru
Given article is devoted to the model of aimed distribution of the budget resources in the region, and shows how this model may be applied at the situational center. Authors describe the model and the example of its programming realization.
решения (особенно групповые решения по сложным, многофакторным проблемам) принимаются в среде ситуационного центра (СЦ) с активным использованием интеллектуальных информационно-коммуникацион-
Введение
Обучение принятию решений является современным направлением в общем, профессиональном и дополнительном образовании. Наиболее эффективно управленческие