Серия «Математика»
Том 2 (2009), № 1, С. 8-36
Онлайн-доступ к журналу: http://isu.ru/izvestia
УДК 519.626
Равновесное программирование: модели и методы решения *
А. С. Антипин
Вычислительный центр Российской академии наук
Аннотация. Рассматривается концепция равновесного программирования, которая включает в себя сложные системы задач оптимизации, в частности, игры п-лиц с равновесием по Нэшу, равновесные и многокритериальные равновесные задачи, многокритериальные задачи с оптимальностью по Парето, седловые игры п-лиц с седловой неподвижной точкой. Обсуждаются экстрапроксимальные и экстрагради-ентые подходы для их решения. Предлагаются равновесные экономические модели, сформулированные на основе концепции равновесного программирования.
Ключевые слова: равновесное программирование, равновесные решения, седло-вые точки.
Переход от изучения отдельных объектов к исследованию систем или множеств таких объектов представляет собой основной элемент любого развития. В математике это можно видеть на примере перехода от исследования отдельных функций, уравнений, задач оптимизации к исследованию функциональных пространств, систем уравнений, задач теории игр. В оптимизации такой переход стимулируется вовлечением в исследование сложных объектов типа рынков, сетевых структур, больших системных задач. Все это, в свою очередь, приводит к конструированию сложных систем задач оптимизации.
Основная особенность направления этих исследований состоит в присутствии в нем человеческого фактора. Пока этот фактор моделируется с помощью простых средств: целевых функций, функций предпочтений, полезности, выигрыша, хотя уже и сейчас рассматриваются
* Работа выполнена при финансовой поддержке Российского фонда фундаментальных исследований. Код проекта РФФИ 09-01-00388 и Программы государственной поддержки ведущих научных школ НШ-5073.2008.1
Введение
различные «формулы человека». Целевые функции дают возможность решать основную проблему человеческой активности - проблему выбора, отличать одни альтернативы, более предпочтительные от других менее предпочтительных. Проблема выбора приводит к различным постановкам задач оптимизации от простейшего выбора предпочтительной альтернативы с одним участником до сложного группового выбора в ситуациях со многими участниками. В последнем случае, каждый из участников не зависимо друг от друга делает свой выбор на своем множестве альтернатив, но потом возникает необходимость убедиться, что групповой выбор удовлетворяет некоторым условиям, которые характеризуют группу как единое целое. Выбор отвечающий этим условиям обладает качественно новой характеристикой согласовывать частично противоречивые интересы участников ситуации, а сама система, особенно в ее математической постановке, может трактоваться как модель конфликта, а ее решение как компромисс или равновесие.
В математической постановке каждый из участников представлен своей задачей оптимизации, зависящей от параметров, которые в свою очередь являются переменными других участников. Эту систему задач всегда можно скаляризовать (просуммировать с весами) и ввести экстремальное отображение некоторого множества в себя. Как правило, такое отображение имеет неподвижную точку, которая одновременно является решением исходной системы задач оптимизации. Такой ход рассуждений представляет собой естественный переход от классической задачи выпуклого программирования к задачам игрового типа, при этом меняется парадигма решения: вместо оптимального решения мы получаем неподвижную точку или равновесие. Новый класс задач представляет собой обширную область исследований, более общую чем игры п-лиц с равновесием по Нэшу. Эту область исследований в дальнейшем будем называть равновесным программированием. Основное отличие равновесного программирования от идейно близкой теории вариационных неравенств состоит в стремлении здесь моделировать человеческий фактор с помощью целевых функций, которые дают возможно различать альтернативы выбора, что в конце концов должно привести к вычислению равновесного группового выбора. Техника вариационных неравенств не дает такой возможности.
В основе предлагаемой работы лежат понятия экстремального отображения, которое порождается бифункцией (функцией от переменных одинаковой размерности; аналог матрицы индексы элементов которой, можно трактовать как переменные одинаковой размерности), неподвижной точки этого отображения и методов вычисления. Рассматриваются три типа экстремальных отображений: 1) простое экстремальное отображение, порожденное бифункцией, 2) экстремальное отображение, с неподвижной точкой в образе другого отображения, 3) седловое экстремальное отображение. Рассмотрим по порядку постановки рав-
новесных задач, математические модели к которым они приводят и подходы к методам решения этих задач.
1. Предварительная теория.
История развития групповых представлений в математическом моделировании имеет относительно не долгую историю. Одной из простейших игр является седловая задача. Итоги по исследованию этой задачи, начатой в 20-х годах прошлого столетия подведены в знаменитой книге фон Неймана и Моргенштерна (1944 г.). Было установлено, что выпукло-вогнутая функция на ограниченном выпуклом множестве всегда имеет седловую точку. В 1951 г. Нэш дал постановку игры п-лиц и доказал существование решения этой игры. Относительно быстро стало понятно, что седловая задача является игрой двух лиц с нулевой суммой. Однако, развитие теории методов решения игр п-лиц натолкнулось на значительные трудности, которые привели к тому, что такая теория до сих пор не создана. Первым из игровых методов, получивших известность является метод Удзавы (1958 г.), который представляет собой классический градиентный седловой метод, т.е. спуск по одной переменной и подъем по другой. Однако, после его публикации выяснилось что метод не сходиться к седловой точке. Следующим шагом в развитии игровых методов была так называемая теория методов модифицированной функции Лагранжа (1973 г.). В рамках этой теории были развиты методы, которые сходились монотонно (по норме пространства прямых и двойственных переменных) к седловой точке функции Лагранжа задачи выпуклого программирования. Из работ посвященных собственно методам решения игр п-лиц, которых в целом было не много, следует отметить известную работу Л.Б.Иовеп (1965 г.), в которой автор с позиций классического анализа пытался использовать идею градиентного метода. Понятно, что доказать сходимость такого подхода можно было в ситуациях, где работает принцип строго сжимающих отображений.
В данной работе на примере игры двух лиц рассматривается теория методов игр п-лиц с положительной суммой , которая включает в себя игры с нулевой суммой. Основой теории является новое неравенство, которое в классе бифункций выделяет подкласс функций аналогичных, классу положительно полуопределенных матриц или в более общем контексте положительных чисел. В случае билинейной функции это неравенство превращается в хорошо известное в линейной алгебре определение положительно полуопределенной матрицы. Введенное неравенство позволяет характеризовать игры п-лиц с точки зрения двух фундаментальных понятий выпуклости и положительной полуопреде-ленности (эти понятия совпадают в линейной алгебре и различаются для бифункций, т.е. игр). С помощью выпуклости можно характеризо-
вать индивидуальное поведение игроков , а с помощью положительной полуопределенности - групповое поведение этих же игроков. Введенное неравенство для нелинейных функций дает возможность выделить подкласс выпуклых игр, который является точным аналогом класса задач выпуклого программирования в нелинейной оптимизации. Для этого класса задач в работах [1],[2] развита теория экстрапроксимальных, экс-траградиентных методов, которые можно рассматривать как управляемые с помощью обратных связей градиентные и проксимальные методы известные в оптимизации.
Рассмотрим кратко формальную логику этой теории. Пусть Ь(х,р)
- выпукло-вогнутая функция, определенная на выпуклых замкнутых множествах х € Q Q Кп, р € Р Q Кт. Предполагается, что эта функция имеет седловую точку х*,'р*, т.е. точку, удовлетворяющей системе неравенств
Ь(х*,р) < Ь(х*,р*) < Ь(х,р*), х € Q,p € Р. (1.1)
Правое неравенство этой системы говорит нам о том, что при фиксированном значении р = р* € Р точка х = х* € Q является минимумом функции Ь(х,р*) на множестве Q. Аналогично расшифровывается и левое неравенство системы (1.1): при фиксированном значении х = х* € Q точка р = р* € Р является максимумом функции Ь(х*,р) на множестве Р. Известно, что в оптимальных точках выполняются необходимые (а в выпуклом случае и достаточные) условия экстремума в виде вариационных неравенств, т.е.
(ЧЬр(х*,р*),р—р*) < 0, (ЧЬх(х*,р*),х—х*)> 0, Ух € Q,p € Р, (1.2)
где УЬр(х*,р*), УЬх(х*,р*) частные градиенты или субградиенты (в зависимости от дифференцируемости или субдифференцируемости выпукло-вогнутой функции Ь(х,р) ) по переменным р или х.
Неравенства (1.2) в свою очередь можно переписать в форме операторных уравнений с операторами проектирования пр(...), пд(...) векторов на соответствующие множества, т.е.
р* = пР (р* + аЧЬр(х*, р*)), х* = пд(х* — аЧЬх(х* ,р*)). (1.3)
Пара х*,р* является неподвижной точкой, или точкой равновесия. Система (1.3) имеет простой геометрический смысл: если из точки х* ,р* сделать шаг по частным градиентам (антиградиентам) седловой функции Ь(х,р), то после проектирования процесс снова окажется в той же точке х*,р*.
Наряду с явной градиентной системой (1.3) существует ее неявная форма в виде системы проксимальных уравнений
р* € а^шах{ —2|р — р*|2 + аЬ(х*,р) | р € Р},
х* € а^шш{1 |х — х*|2 + аЬ(х,р*) | х € Q}. (1.4)
Системы (1.1)—(1.4) эквивалентны (см. [3]). Любую из них можно принять в качестве определения седловой точки.
Во многих случаях систему задач (1.1) удобно скаляризовать и привести к задаче вычисления неподвижной точки экстремального отображения. С этой целью введем нормализованную функцию двух переменных одинаковой размерности
Ф(-и,ад) = £(я,р) — Ь(х,у), w = (г,у),V = (х,р),
ад^ € Ш = Q х Р, тогда исходная седловая задача (1.1) может быть сведена к задаче вычисления неподвижной точке экстремального отображения, порожденного нормализованной функцией
х* € Ащтт{Ф^*, ад) | ад € Ш} (1.5)
или, что то же самое, игре двух лиц
х* € А^шт{£(х,р*) | х € Q},
р* € Ащтт{—£(х*,р) | р € Р}. (1.6)
Используя факт сепарабельности функция Ф^, ад) = £(г, р) — £(х, у) по переменным г € Q и у € Р, и блочную структуру множества Ш = X х Р не трудно видеть, что задачи (1.1), (1.5) и (1.6) эквивалентны.
Убедимся, что нормализованная функция удовлетворяет следующим свойствам:
Ф(ад, ад) = 0, ад € Ш, (1.7)
Ф(ад, V) + Ф^, ад) = 0, V, ад € Ш. (1.8)
Первое свойство означает, что на диагонали квадрата, т.е. при V = ад, функция Ф^,ад) равна нулю. Действительно, при V = ад имеем Ф(ад, ад) = £(г, у) — £(г, у) = 0. Второе свойство определяет антисимметрию функции Ф^, ад). Так как область изменения переменных функции одна и та же, то положим V = ад, ад = V, тогда Ф^,ад) + Ф(ад^) = £(г,р) — £(х, у) + Ь(х,у) — £(г,р) =0. Свойство (1.7) объясняет почему игра (1.6) называется игрой с нулевой суммой.
Сложив равенства (1.7) и (1.8), получим тождество
Ф(ад, ад) — Ф(ад, V) — Ф^, ад) + Ф^, V) = 0, V, ад € Ш. (1.9)
Положим V = V* в (1.8)
Ф(ад, V*) + Ф(v*,ад) = 0, V,ад € Ш. (1.10)
Перепишем задачу (1.5) в форме
Ф^>*) < Ф^*,ад), ад € Ш. (1.11)
Здесь же отметим, что из (1.9) с учетом (1.11) имеем
Ф(-ш, ад) — Ф(ад, V*) > 0, w € Ш. (1.12)
Сопоставляя (1.10) и (1.11), получим
Ф^, V*) < 0, w € Ш. (1.13)
Объединяя неравенства (1.11) и (1.13), имеем
Ф^Х) < Ф(v*,v*) < Ф(v*,w), w,v € Ш. (1.14)
Таким образом, установлено, что пара v*,v* является седловой точкой функции Ф^^). Поскольку эта пара лежит на диагонали квадрата, то V* € Ш является неподвижной точкой экстремального отображения, порожденного функцией Ф^^).
Задачу (1.5) всегда можно переписать в эквивалентной форме градиентного
V* = п№ (V* — аУФад (V*, V*)) (1.15)
или проксимального уравнений
V* € а^тт{1 ^ — v*|2 + aФ(v*, w) | w € Ш}. (1.16)
Эти уравнений в свою очередь приводят нас к методам типа простой итерации
vn+1 = п№ ^п — аУФад С^п)), vn+1 € argmin{2^ — vn|2 + aФ(vn, w) | w € Ш}.
Известно[3], что эти методы сходятся к решениям в случае задач оптимизации и соответственно не сходятся в равновесном случае. Последнее связано с тем, что операторы УФад^^)|^=ад и его неявный аналог из проксимального процесса не являются потенциальными, т.е. не являются градиентами ни для каких вещественных (целевых) функций. Поскольку потенциальная энергия в этих процессах изначально отсутствует, то ее надо привнести дополнительно. Формально это можно сделать с помощью введения управлений в виде обратных связей в правые части уравнений [4].
Рассмотрим идею управления на примере проксимальной системы. Введем в эту систему аддитивное управление и = — V”-) в
общем случае, зависящие от координат текущей точки и от разности смещения этой точки в соседнюю
vn+1 € а^тт{2^ — vn|2 + aФ(vn + и, w) | w € Ш}. (1.17)
Наиболее известны управления по производной (смещению) и по невязке
и = vn+1 — vn, и = ащтт{1 ^ — vn|2 + о:Ф^п, w) | w € Ш} — vn.
Замыкание системы (1.17) управлением по невязке приводит нас к процессу вида
Vn € а^тт{2|w — vn|2 + о:Ф^п, w) | w € Ш},
vn+1 € а^тт{-^ — vn|2 + о:Ф^п, w) | w € Ш}. (1.18)
2
Этот процесс распадается на два полушага, где первый полушаг трактуется как управление в форме обратной связи в виде экстраполяции или прогноза. Этот процесс будем называть экстрапроксимальным методом [5]. Градиентный аналог этого метода, который называется экс-траградиентным (термин Б.Т.Поляка) как следует из (1.15) имеет вид [6]
vn = (vn — аУФад (vn,vn)),
vn+1 = (vn — аУФад (й”, Vn)). (1.19)
Здесь (...) - оператор проектирования некоторого вектора на выпук-
лое, замкнутое множество Ш € Лп. Оба этих процесса распространяют идею градиентных и проксимальных методов известных в оптимизации на равновесные (игровые, седловые) задачи.
Таким образом на примере седловой задачи (или игры двух лиц с нулевой суммой) мы ввели экстремальное отображение, которое отображает некоторое множество в себя. Как правило, это отображение имеет неподвижную точку. Эта точка является решением седловой, игровой или задачи более сложной конструкции. Показана логика, которая приводит к методам решения сложных задач игрового типа. Далее в рамках теории равновесного программирования мы рассмотрим некоторые достаточно сложные постановки равновесных задач с точки зрения их приложений и вычисления решений.
2. Простое экстремальное отображение.
В этом разделе рассмотрим равновесную задачу, порожденную простым экстремальным отображением вида[7]
V* € А^тт{^>^) + Ф^*^) | w € Ш}. (2.1)
Здесь ^>^) + Ф^^)- непрерывная, выпуклая по w € Ш для любого
V € Ш функция, Ш С Лп - выпуклое замкнутое множество. Предполагается, что решение экстремального включения (2.1) всегда существует. Например, его гарантирует теорема Какутани [8], если дополнительно множество Ш компактно.
Для построения методов решения этой задачи будем предполагать, что бифункция задачи Ф^^), v,w € Ш удовлетворяет свойству положительной полуопределенности, т.е. выполняется неравенство [9]
Ф^, w) — Ф^, V) — Ф^, w) + Ф^, V) > 0, V, w € Ш. (2.2)
В частности, если бифункция Ф^^) = (Фv, w) представляет собой билинейную функцию, порожденную матрицей Ф, то неравенство (2.2) принимает вид (Ф^ — w),v — w) > 0 для всех v,w € Ш. Последнее неравенство определяет матрицу Ф как положительно полуопределен-ную. В линейной алгебре условие положительной полуопределенности для квадратичных функций гарантирует выпуклость этих функций. Близкую роль условие (2.2) играет и в равновесных задачах. Это условие можно рассматривать как обобщение идеи положительной полу-определенности матриц на нелинейные бифункции. В частности, если Ф^^) = 0, то условие (2.2) включает в себя условие антисимметрии Ф^^) = — Ф^^). Антисимметрия фактически описывает функции седлового типа. Условие (2.2) включает в себя также условие симметрии Ф^^) = Ф^^). В этом случае (2.1) эквивалентно обычной задаче оптимизации. Условия симметрии и антисимметрии - это аналоги симметричных и антисимметричных матриц. Если функция Ф^, w) выпуклая по w для любого V, то применяя последовательно к (2.2) условия выпуклости
(V/(х),у — х) < / (у) — / (х) < (V/(у),у — х), х,у € X
получим
^2Ф^^) — V2Ф(v,v),w — V) > 0 Vw,v € Ш, (2.3)
т.е. градиент-сужение V2Ф(v,w)|v=Г положительно полуопределенной, выпуклой по w для любого V функции Ф^^) есть монотонный оператор. Сужение матрицы смешанных производных второго дифференциала функции Ф(v, w) на диагональ квадрата д |^=ад также характе-
ризует свойства бифункции. Действительно, установлено, что если бифункция является симметричной, антисимметричной или положительной полуопределенной, то аналогичными свойствами обладает сужение матрицы смешанных производных на диагональ квадрата, верно и обратное утверждение [2].
В пространстве бифункций выделим два базисных подпространства симметричных и антисимметричных функций. Эти подпространства
определяются следующими условиями:
Ф^^) — Ф^^)=0, Ф(v, w) + Ф(w, V) = 0 (2.4)
для всех w € Ш, V € Ш. Введенные подпространства можно рассматривать как систему «координат» в которой любая бифункция может быть разложена в системе базисных пространств. Действительно, пара точек с координатами w, V и V, w расположена симметрично относительно диагонали квадрата Ш х Ш, т.е. относительно линейного многообразия
V = w. Это дает возможность ввести понятие транспонированной функции поставить в соответствие значение функции Ф(.,.) вычисленной в точке w, V, т.е. V, w ^ Ф^, V), то получим транспонированную функцию Фт^^) = Ф^^). В терминах этой функции условия симметричности и антисимметричности имеют вид
Ф (V, w) = Фт (V, w), Ф (V, w) = —Фт (V, w).
Используя очевидные соотношения Ф^^) = (ФТ^^))Т, (Фl(v, w) + Ф2(V, w))T = Ф^(V, w) + Ф^(V , w), нетрудно проверить, что любую вещественную функцию Ф^^) всегда можно представить в виде суммы
Ф^^) = £^^) + К ^^), (2.5)
где функция 5(V, w) - симметричная, а К^^) - антисимметричная. Это разложение единственно, причем
5^, w) = 1 (ф(у, w) + Фт(V, w)) , К(V, w) = 1 (ф(у, w) — Фт(V, w)) .
(2.6)
Функции 5(V, w) и К(v,w) можно трактовать как «координаты» разложения Ф^^) в базисе симметричных и антисимметричных функций. Поскольку симметрическая часть разложения (2.5) при оптимизации по w приводит к задаче оптимизации, то в этом случае мы приходим к общей форме задачи равновесия (2.1), где Ф^^) без ограничения общности можно считать антисимметричной, а ^>^) играет роль К(V, V) [10].
Для решения равновесной задачи (2.1) с произвольной положительно полуопределенной функцией Ф(v, w) не обязательно седловой применимы подходы (1.18),(1.19). Например, для равновесной задачи с функциональными ограничениями
V* € А^тт{^>^) + Ф^*^) | д^) < 0^ € Ш}. (2.7)
Здесь ^>^) + Ф^^)- непрерывная, выпуклая по w € Ш для любого
V € Ш функция. Аналог (1.18) для этой задачи имеет вид:
первый полушаг (прогнозный)
р” = п+(р” + ад(Л),
Vй € Ащтш{1/2^ — V”!2 + аЬ^”, w,pn) | w € Ш}, второй полушаг (основной)
р”+1 = п+(р” + ад^”)),
vn+1 € Argmin{1/2|w — vn|2 + аЬ^^р”) | w € Ш}, (2.8)
где Ь^^,р) = ^>^) + Ф(v,w) + (р,д^))^ € Ш,р > 0 - функция Лагранжа задачи (2.7). Длина шага а в этом процессе определяется из некоторого интервала 0 < а < ао. Сходимость этого процесса доказана для произвольной положительно полуопределенной функции Ф^, w)[11].
Важная роль задачи (2.1) состоит в том, что она включает в себя игры п-лиц с положительной суммой. Этот класс игр расширяет игры с нулевой суммой. Покажем это на примере игры двух лиц с равновесием по Нэшу в простейшем случае без функциональных ограничений
х1 € Ащтт{^ч(21) + /1(21, х2) | 21 € Х1},
х* € Ащтт{^>2(22) + /2(х1, 22) | 22 € Х2}, (2.9)
где функции ^(21)+/1(21, х2), ^>2(22) + /2(х1, 22) непрерывны и выпуклы по собственным переменным, т.е. первая функция выпукла по 21, вторая
- по 22 при любых фиксированных значениях Х1 и Х2, а Х^,г = 1, 2 выпуклые замкнутые множества.
В игре (2.9) каждый из игроков решает задачу минимизации выпуклой целевой функции по собственной переменной при фиксированном значении параметра, который является одновременно переменной для другого участника. Если в состоянии равновесия, каждый из участников сделает проксимальный шаг, то ни один из них не покинет это состояния, т.е.
х* = а^тш{1121 — х1|2 + а(^(21) + /1(21, ж*)) | 21 € Х1},
х* = argmin{1122 — х2|2 + а(^(22) + /2(х*, 22)) | 22 € Х2}.
Каждое из уравнений этой системы можно рассматривать как необходимое, а в выпуклом случае, достаточное условие минимума любой из задач системы (2.9).
Процесс (1.18) для задачи (2.9) принимает вид: первый полушаг (прогнозный)
х” = ащтт{1121 — х”|2 + а(^ч(21) + /1(21, х”)) | 21 € Х1}, х” = argmin{1122 — х”|2 + а(^(22) + /2(х”, 22)+) | 22 € Х2},
второй полушаг (основной)
х”+1 = а^тш{2121 — х”|2 + а(^ч(21) + /1(21,®”)) | 21 € Х1},
х”+1 = argmin{2122 — х”|2 + а(^(22) + Ых”^)) | 22 € Х2}, (2.10)
где длину шага а будем выбирать из некоторого фиксированного интервала 0 < а < ао.
При обсуждении вопросов сходимости этого метода важно подчеркнуть, что оба игрока представляют единую систему, которая с изменением номера итерации эволюционирует к равновесию и характер этой эволюции определяется, в основном, системными свойствами, т.е. свойствами системы игроков, как единого целого. Базовое системное свойство мы сформулируем в терминах нормализованной функции
<£^) + Ф(v, w) = ^1(21) + /1(21, х2) + ^2(22) + /2(х1, 22),
где w = (21, 22), V = (х1,х2), v,w € Ш = Х1 х Х2. Это свойство включает условие положительной полуопределенности, которое нельзя получить как сумму свойств отдельных игроков. Игры этого класса в дальнейшем будем называть играми с положительной суммой. Полная теория этих игр, включая игры с функциональными и связанными переменными изложена в [12],[13].
3. Экстремальное отображение, с неподвижной точкой в образе другого отображения
Рассмотрим систему включающую экстремальное отображение и уравнение
w* € А^тт{^>^) + Ф(и*, /(w)) | w € Ш},
V* = / К), (3.1)
где /^*) € ^ = {/^) | w € Ш}. Здесь <£^) + Ф(v,w) - непрерывная, выпуклая по w € Ш для любого V € Ш функция, /^) - векторная функция, каждая компонента которой скалярная выпуклая функция, Ш С Л” - выпуклое замкнутое множество. Предполагается, что решение этой задачи существует. Напомним, что в (2.1) переменные V и w были одной и той же размерности. Здесь же размерности этих переменных, вообще говоря, разные однако размерности переменных V и /^) совпадают.
Далее мы рассмотрим задачу (3.1) с билинейной функцией Ф^, /^)), а именно с функцией скалярного произведения, Ф^, /^)) = (V, /^)), которая обладает всеми выше перечисленными свойствами
бифункции. Общую параметрическую постановку такой задачи можно сформулировать в форме
w* € А^тт{(А*,/^)) | д^) < Т2р*, w € Ш}, (3.2)
(Л — А*,/^*) — Т А*) < 0, А > 0, (3.3)
(р — р*,д^*) — Т2Р*) < 0, р > 0. (3.4)
Здесь /^),д^)- векторные функции, каждая компонента которых вы-
пуклая скалярная функция, /^) € Л™1 , д^) € Л™2, А € Лт1, Р € Л™2, w € Ш С Я”. Параметрами этой задачи являются матрицы Т = (Т1,Т2), где Т1,Т2 - симметричные положительно полуопределенные матрицы, размерности которых согласованы с соответствующими переменными. В рассматриваемой задаче при некотором фиксированном значении параметра Т > 0 требуется выбрать векторы весов А = А* > 0 и р = р* > 0 так, чтобы отвечающий им оптимум w = w* удовлетворял системе вариационных неравенств. В выпуклом регулярном случае решение этой задачи, т.е. вектор w* € Ш, А* > 0,р* > 0, при фиксированных значениях параметра Т всегда существует. Сформулированная задача представляет собой задачу многокритериального равновесного программирования с равновесными ограничениями.
Первые постановки вида (3.2)-(3.4) обсуждались в [14], [15]. Близкие к ним частные аналоги задачи (3.2)-(3.4) (параметр А из (3.2) априори фиксирован) были сформулированы в рамках теории вариационных неравенств [16],[17]. Насколько известно автору идея многокритериальной равновесной оптимизации (переменные А и w разной размерности) впервые прозвучала в постановке (3.2)-(3.4) [18].
Система (3.2)-(3.4) включает в себя классическую задачу выпуклого программирования, задачу многокритериальной равновесной (и просто многокритериальной) оптимизации, задачу выбора равновесного допустимого множества в скалярной оптимизации и другие равновесные постановки. Сфера приложений рассматриваемой задачи обширна. Это модели автоматизации проектирования, модели экономического равновесия, модели согласования дефицита ресурсов и другие.
Задача (3.2) при фиксированных переменных А = А*,р = р* представляет собой задачу выпуклого программирования относительно переменной w € Ш. Следуя традиции выпуклой оптимизации введем седловую функцию, которая будет играть роль аналогичную функции Лагранжа в выпуклом программировании. Эта функция имеет вид
Ь(А, р, w) = (А, /^) — 2Т1 А) + (р, дМ — 1 Т2р) (3.5)
для всех А > 0,р > 0, w € Ш. Отметим, что эта функция выпукловогнутая относительно прямых w € Ш и двойственных (А,р) > 0 переменных. Выпукло-вогнутые функции, как правило, имеют седловые
точки. Применительно к нашей ситуации точку (А*,р*), w* назовем сед-ловой, если она удовлетворяет системе неравенств
(А,/К) — 1Т1А) + (р,д^*) — 2Т2р) <
< (А*, /(w*) — 2Т1А*) + (р*,д^*) — 2Т2р*) <
< (А*,/И — 2Т1А*) + (р*,дИ — 2Т2р*) (3.6)
для всех А > 0,р > 0,w € Ш. Левое неравенство этой системы означает, что точка (А*,р*) является точкой максимума функции Ь(А,р, w*) по переменным А > 0,р > 0 при фиксированном значении w = w*. Правое неравенство в свою очередь означает, что точка w* € Ш является точкой минимума функции Ь(А*,р*^) по переменной w € Ш при фиксированном значении А* ,р*.
Известно, что теорема фон Неймана гарантирует существование сед-ловой точки выпукло-вогнутой функции, если эта функция определена на выпуклом ограниченном множестве конечно-мерного пространства. В нашем случае, то обстоятельство, что множество определения функции по двойственным переменным не ограничено не имеет особого значения, поскольку по этим переменным функция квадратичная и сильно вогнутая, следовательно обладает свойством бесконечного роста, т.е. Ь(А,р, w) ^ —то, если (А,р) ^ то при любом фиксированном w € Ш. В этом случае теорема фон Неймана работает также и следовательно существование седловой точки для функции (3.5) гарантировано. Подчеркнем, что (3.5) не относится к функциям Лагранжа, поскольку она не является линейной по двойственным переменным. Нетрудно доказать, что седловая точка функции Ь(А,р, w) является равновесным решением (3.2)-(3.4).
Из системы (3.6) следует, что задачу (3.2)-(3.4) можно представить в эквивалентной форме, как
w* € А^тт{(А*, /^)) + (р*,д^)) | w € Ш},
(А — А*,/^*) — Т1 А*) < 0, А > 0,
(р — р*,д^*) — Т2р*) < 0, р > 0. (3.7)
или как
w* € А^тт{(А*, /(w)) + (р*,д^)) | w € Ш},
А* = п+(А* + а(/^*) — Т*А*)),
р* = п+(р* + а(д^*) — Т* р*)). (3.8)
Здесь невязки двух последних уравнений порождают векторные поля, неподвижные точки которых являются решениями исходной задачи.
При различных значениях параметра Т = (ТьТ^) в (3.2)-(3.4) мы будем получать различные, часто не очень близкие равновесные задачи. В этой работе мы рассмотрим три базовых случая. Сначала остановимся на задаче выпуклого программирования, затем рассмотрим задачу с равновесными весами, а затем с равновесными ограничениями.
3.1. Задача выпуклого программирования
Пусть векторная функция /(ад) имеет структуру /(ад) = (/і(ад), 0,..., 0), т.е. все компоненты кроме первой, функции тождественно равные нулю, а матричные параметры принимают значения
Ті =
/1
\
\
0
Т2 =
0
\
\
0
тогда задача (3.2)—(3.4) принимает форму
ад* Є А^шіпІАІ/^ад) | д(ад) < 0,ад Є Ш}, (Лі - Аі)(/і(ад*) - Аі) < 0, Аі > 0, (р — р*,$(^*)) < 0, р > 0.
Используя (3.7), задачу запишем в виде
ад* Є А^шіпІЛі/^ад) + (р*,д(ад)) | ад Є Ш}, (Аі — Аі)(/і(ад*) — Аі) < 0, Аі > 0,
(Р — Р*,$(ад*)) < 0, р > 0. (3.9)
Условие регулярности. Задачу (3.9) назовем регулярной, если функция /і (ад) удовлетворяет условию
/і (ад) > 0 Уад Є Ш.
(3.10)
Используя условие регулярности, нетрудно показать, что в этом случае параметр Аі = 0. Из этого условия, очевидно следует, что (3.9) можно переписать в эквивалентной форме
ад* Є А^шіпІ/^ад) + (р*,д(ад)) | ад Є Ш}, (р — р*,$(^*)) < 0, р > 0.
(3.11)
Отсюда следует, что задача выпуклого программирования содержится в общей конструкции (3.2)-(3.4).
0
0
3.2. Задача многокритериального выпуклого программирования с равновесными весами
В этом случае, пусть /(ад) = (/1(ад), /2(ад), • ••,/т1), т.е. все компоненты выпуклые не равные нулю функции, а матричные параметры принимают значения
/1
Т =
\
/0
1 0
, Т =
\
(3.12)
(3.13)
тогда задача (3.2)—(3.4) принимает вид
ад* € Argmm{(A*,/(ад)) | д(ад) < 0, ад € Ш},
(А - А*,/(ад*) - А*) < 0, А > 0,
(р — Р*,$(ад*)) < 0, р > 0.
Выпишем эту задачу в форме (3.7)
ад* € Argmin{(A*, /(ад)) + (р*,д(ад)) | ад € Ш},
(А — А*,/(ад*) — А*) < 0, А > 0,
(р — Р*,$(ад*)) < 0, р > 0.
Целевая функция задачи (3.12) представляет собой скаляризацию или линейную свертку векторного критерия задачи многокритериальной оптимизации
/(ад*) € ParetoMin{/(ад) | д(ад) < 0, ад € Ш}. (3.14)
Допустимое множество этой задачи Ш = {ад € Ш | $(ад) < 0} бу-
дем называть множеством альтернатив, а его образ / € /(Ш) = {/ = /(Ш),ад € Ш} при отображении /(ад),ад € Ш множеством векторных оценок.
Если вектор /(ад*) принадлежит внутренности положительного ор-танта, тогда из второго неравенства (3.12) очевидно имеем
/(ад*) = Mm{(A*,/(ад)) | #(ад) < 0,ад € Ш},
А* = / (ад*). (3.15)
Содержательный смысл полученного равновесия будет выяснен ниже.
Задача многокритериальной оптимизации (3.14) порождает в качестве множества решений обширное многообразие Паретовских точек. Каждая точка Паретовского многообразия /(ад*) характеризуется тем,
что пересечение неположительного конуса (ортанта) K(/(w*)) с вершиной в точке /(w*), где K(/(w*)) = {/ Є I / < /(w*)}, и множества векторных оценок /(W) содержит единственную точку /(w*).
В этом случае /(w*) называется оптимальной по Парето или эффективной точкой [19]. Эта же мысль в [20] представлена в следующей форме: точка /(w*) называется оптимальной по Парето, если не существует вектора v Є W такого что
/i(v) < /i(w*),i = 1,..., m and /(v) = /(w*),
т.е. неположительный конус K(/i(w*)) из которого выброшена вершина, пуст. Вектор /(w*) в этом случае называют также недоминируемым на множестве векторных оценок.
Расположение множества /(W) в пространстве векторных оценок по отношению к нулевой точке очень зависит от вектора /, который обычно называют «абсолютным минимумом» или «идеальной точкой»: /i = /i(w) = min{/i(w) I w Є W}, i = 1, ...,m. Если векторы w^ различны, то не существует такой точки w образ которой /(w) мог бы достичь «абсолютного минимума» / . Интуиция нам подсказывает, что если / У О, то все компоненты вектора Л* в (3.12) не равны нулю, т.е. Л* = О и наоборот, если / < О, то все компоненты этого вектора равны нулю. При наличии смеси тех и других компонент вектора / имеем случай, когда какие то Лі, i = 1, 2, ...m равны нулю, другие - нет. Чтобы исключить вырожденный случай (когда все Л*, i = 1,...,m равны нулю), введем условие регулярности, которое в каком то смысле аналогично условию регулярности Слейтера в выпуклом программировании.
Условие регулярности. Задачу (3.12) назовем регулярной, если среди всех /i(x),i = 1, 2, ...,m существует по крайней мере одна функция /i(w) такая что
/i(w) > О Vw Є W
По умолчанию всегда можно полагать, что индекс такой функции i = 1. Условие регулярности всегда обеспечивает существование по крайней мере одного ненулевого весового коэффициента. С другой стороны, если нуль пространства и идеальную точку совместить, т.е. переписать задачу (3.12) в форме,
w* Є Argmin{^*, /(w) — /) I g(w) < О, w Є W},
((/(w*) — /) — Л*,Л — Л*) < О, Л У О, (3.16)
то условие положительности весов всегда выполняется. Здесь предполагается, что вектор / (идеальная точка) известен.
Задача (3.14) представляет собой многокритериальную задачу минимизации векторного критерия /(w) на допустимом множеств W = {w Є W I g(w) < О}. Решение этой задачи, как отмечалось ранее, есть
обширное многообразие оптимальных по Парето (или эффективных) точек. Напомним, что если точка /(ад*) является Парето-оптимальной, то линейный функционал (А*,/), где / = /(ад) для всех ад € Ш является опорным в точке /(ад*), так как (А*,/*) < (А*,/) для всех К = {/ € Ят1 | / = /(ад),ад € Ш}, т.е.
(А*,/ — /*)> 0, / € К (3.17)
Таким образом, задачу многокритериальной оптимизации можно интерпретировать как поиск опорного функционала с неотрицательными весами на множестве векторных оценок при этом прообраз опорной точки принадлежит множеству альтернатив.
С другой стороны рассмотрим задачу проектирования нуля на множество векторных оценок К.
/* = а^т{2|/12 1 / € ^}.
Необходимое условие минимума для этой задачи имеет вид
(/*,/ — /*)> 0, / € К (3.18)
Сравнивая (3.17) и (3.18), получаем А* = /* = /(ад*), т.е. решение задачи (3.12) - вектор /(ад*) - является проекцией нулю на множество допустимых оценок (нормальное решение).
Если рассматривать задачи (3.12) или (3.13) как математические модели некоторых реальных ситуаций, например, как модели автоматизации проектирования (для технических систем) или как экономические модели со многими участниками в производственных процессах, то любой вектор /(ад*) (оптимальное по Парето решение) называется вектором эффективности поскольку характеризует эффективность принятого решения. Компоненты вектора А* (весовые коэффициенты) характеризуют вес или престиж каждого участника группы или фактора (для технических систем) в принятии оптимального решения. Интуитивно ясно, что если престиж участника не высок, то его эффективность должна быть мала и наоборот, если эффективность высока, то престиж такого участника в группе должен быть высоким. Именно этот смысл содержится в равенстве системы (3.15) для случая, когда вектор /(ад*) содержится строго внутри положительного ортанта и в уравнении (3.12) для случая, когда некоторые компоненты этого вектора равны нулю.
Проясним содержательный смысл решения задачи (3.12),(3.13). Как уже отмечалось выше совокупность парето-оптимальных решений представляет собой обширное множество. Ключевое свойство элементов этого множества состоит в том, что при перемещении из одной точки множества в другую, если значение какой-то функции улучшается, то всегда найдется другая функция значение которой ухудшиться,
т.е. нельзя из данной точки сдвинуться так, чтобы улучшить значение одной функции при этом не ухудшить значения других. С точки зрения парето-оптимальности все решения задачи (3.12),(3.13) не различимые точки. Но с любым векторным критерием всегда связана идеальная точка, эта точка нижних границ значений всех критериев, т.е. /г = /г(-ш) = шт{/г(эд) | ад € Ш}, г = 1,2, ...т. Эта точка, в
общем случае, всегда лежит вне парето-оптимального множества решений, т.е. не существует такой точки w образ которой /(ад),w € Ш мог бы достичь идеального минимума. Идеальный минимум как центр индивидуальных интересов самое притягательное решение с точки зрения всех участников ситуации интересы которых представлены компонентами векторного критерия, ибо в идеальной точке значения всех критериев самые минимальные, но не достижимые. С точки зрения концепции парето-оптимальности все участники образуют группу и их групповые интересы представляют парето-оптимальные решения. Парето оптимальное решение самое близкое к идеальной точке (центру индивидуальных решений) без сомнения являются решением, которое устраивают всех участников группы, именно, эта точка является естественным обобщением понятия минимального значения целевой функции в скалярной оптимизации. Таким образом, если рассмотреть задачу проектирования идеальной точки на выпуклое множество векторных оценок /(Ш), то ее решение будет парето-оптимальной точкой, поскольку она лежит на границе /(Ш). Эту единственную парето-оптимальную точку в дальнейшем будем называть нормальным решением. Отметим что в зависимости от вида задач часто приходится проектировать на множество / (Ш), не идеальную точку, а начало координат пространства (эти точки могут совпадать). Все выше проведенные рассуждения не зависят от точки проектирования и проекцию в этом случае также будем называть нормальным решением задачи.
Рассмотрим теперь какой содержательный смысл имеет вторая компонента решения А* задачи (3.12). Как уже говорилось все участники ситуации образуют группу со своими индивидуальными и групповыми интересами, которые нужно согласовывать. Операция линейной скаля-ризации векторного критерия /(ад) присваивает каждому участнику некоторой вес Аг, г = 1, 2, ...,т, который в дальнейшем мы будем интерпретировать как уровень (социального) престижа участника /г(ад) в группе. Обоснуем разумность такой интерпретации. Представим (3.12) в виде
(А*,/(ад*))<(А*,/(ад)), w € Ш.
Скалярное произведение представляет собой сумму
г=т
(А,/= X) А/гМ
г=1
из которой мы выделим г — е слагаемое,тогда
(А*,/^*)>г= < (А*,/М)г= +
+А*(/г^) — №*)), w € Ш,; = 1,...т,; = г.
Если подчинить изменение переменной w € Ш дополнительно ограничению (/г^) — /г^*)) < 0, w € Ш, то полученное неравенство можно переписать в виде
(А*, /М)*= < (А*, /М)г=-, /*^) — /г^*) < 0, w € Ш. (3.19)
Здесь А* = 0, поэтому система неравенств представляет собой задачу выпуклого программирования с одним скалярным ограничением. Последнее означает, что w*,A* - седловая точка функции Лагранжа задачи (3.19), а число А* > 0 - множитель Лагранжа, т.е. субградиент функции чувствительности[21] задачи (3.19). Известно [22], что величина субградиента этой функции характеризует уровень ее чувствительности к изменению правой части функционального ограничения задачи (3.19), т.е. вектора /г^*). Чем меньше число А* > 0, тем меньшее изменение претерпевает задача при возмущении правой части ограничения, а значит задача более устойчива к возмущениям г—ой компоненты парето-оптимальной точки, и тем самым остальные участники группы мало зависят от фактора возмущения задачи. Устойчивость г—ой компоненты к возмущению придает г—му участнику более высокий уровень авторитета. Это обстоятельство мы будем интерпретировать как высокий уровень престижа г—го участника по отношению к другим участникам группы. Таким образом, малое значение веса соответствует высокому уровню престижа участника ситуации и наоборот, большому значению веса соответствует малый уровень престижа участника в группе. В этом заключается равновесный смысл решения задачи (3.12).
3.3. Задача выпуклого программирования с равновесными ограничениями
Пусть / ^) = (/1 ^), 0,..., 0), тогда (А*,/ ^)) = А1/^).
/1
Т =
\
1
\
\
0 1
, Т =
тогда задача (3.2)—(3.4) принимает форму
ад* Є Argmin{Л1/1(ад) | д(ад) < р*, ад Є Ш}, (Лі - Лі)(/і(ад*) - Л1) < 0, Лі > 0,
(р — р*,д^*) — р*) < 0, р > 0. (3.20)
Используя (3.7), запишем задачу (3.20) в форме
w* € А^шт^Д^) + (р*,д^)) | w € Ш},
(А1 — А1)(ДЮ — А1) < 0, А1 > 0,
(р — р*,дМ — р*) < 0, р > 0. (3.21)
В регулярном случае величина А1 =0 и задача (3.21) приводится к виду
w* € А^шт^^) + (р*,д^)) | w € Ш},
(р — р*,д^*) — р*) < 0, р > 0, (3.22)
или к виду
w* € Argшin{/1(w) | д^) < р*, w € Ш},
(р — р*,дМ — р*) < 0, р > 0. (3.23)
при этом ее решение р*, w* является седловой точкой функции Лагранжа Ц(р^) = /l(w) + (р*,д^) — р*), w € Ш. Системы (3.20)-(3.23) эквивалентны. В этой задаче требуется выбрать параметр у = р* (вектор-столбец правой части функциональных ограничений), так чтобы отвечающие ему вектор множителей Лагранжа р* и вектор д^*) удовлетворяли вариационному неравенству из (3.23), т.е. д^*) — р* =0 и соответственно у* = д^*) для случая, когда точка д^*) лежит внутри положительного ортанта и р* = а^шш{2 |р—д^*)|2 | р > 0} для случая, когда точка д^*) лежит на границе положительного ортанта. Этими равенствами определяется равновесное состояние задачи.
3.4. Равновесная модель фирмы
На базе задачи (3.23) можно разрабатывать разнообразные равновесные модели фирмы (производства). Например, рассмотрим модель вида
ж* € Ащшт{/(ж) | д(ж) < р*, ж € X}, (3.24)
(р — р*,д(ж*) — р*) < 0, р > 0, (3.25)
р* = «(у*). (3.26)
Здесь задачи (3.24),(3.25) определяют седловую точку функции Лагранжа Ц(х,р) = /(ж) + (р,д(ж) — «(у*)) для всех ж € X,р > 0, подчиненную системе неравенств
/(ж*) + (р,д(ж*) — в(у*)) < /(ж*) + (р*,д(ж*) — в(у*)) <
< /(ж) + (р*,д(ж) — в(у*))
для всех ж € X,р > 0 и случая, когда р* = «(у*). Таким образом, в этой задаче требуется выбрать вектор ресурсов в (у*) (вектор правой части функциональных ограничений задачи (3.24)) так чтобы он совпал с вектором множителей Лагранжа (уравнение (3.26)). Вектор множителей Лагранжа представляет собой субградиент функции чувствительности
Р(у) = /(ж*) = Мт{/(ж) | д(ж) < у, ж € X}, (3.27)
т.е. = р, а вектор в(у) градиент функции стоимости ресурсов
5 = 5(у), т.е. = в(у). Другими словами, оба градиента имеют
смысл цен, точнее маргинальных цен. Множители Лагранжа - это внутренние цены связанные с технологией модели, а в (у) - это внешние цены рынка. Векторная функция в (у) = р отображает вектор ресурсов у, измеренный в натуральных единицах, в стоимости, измеренные в денежных единицах. Тогда отношение р/в(у) обозначает стоимость единицы ресурса, т.е. его цену. Отображение р = в(у) изначально можно считать пронормированным, тогда обе переменные будут иметь смысл цен и можно говорить о их равенстве. Обе переменные можно покоординатно перемножать, что будет означать пересчет цены ресурса из одной системы цен в другую, например, внешние цены во внутренние и наоборот.
Решение системы (3.24)-(3.26) распадается на две независимые задачи, сначала решается седловая задача (3.24),(3.25), затем используя найденное значение вектора множителей Лагранжа решается уравнение
(3.26). Решение уравнения у = у* представляет собой «точку пересечения» двух многозначных отображений, одно из которых - субградиент функции чувствительности, другое (суб)градиент функции стоимости ресурсов. В точке пересечения выполняется условие равенства цен
(3.26). Отклонение от точки равновесия у = у* порождает либо рост цен на ресурсы за счет увеличения их объема, либо рост цен (множителей Лагранжа) за счет усиления дефицита ресурсов. Любые отклонения от равновесия придают системе не устойчивый характер.
3.5. Методы решения многокритериальных задач равновесного программирования
Все равновесные задачи и модели рассмотренные в разделе 4. являются частным случаем общей конструкции (3.2)-(3.4). Поэтому методы разработанные для решения (3.2)-(3.4) в равной мере будут относится ко всем задачам раздела. Здесь мы используем конструкцию экстра-проксимального метода идея которого обоснована в (1.18),(1.19). Применительно к решению задаче (3.2)-(3.4) прямая и двойственная форма экстрапроксимального метода имеют вид [18].
Прямой экстрапроксимальный метод:
первый полушаг (прогнозный) по прямым переменным
гуга = а^шш{2|w — w”'|2 + а((Ага,/^)) + (рга,д^))) | w € Ш0}; (3.28) шаг по двойственным переменным
Ага+1 = argшin{2|А — Ап|2 — а(А, /(гуга) — 2Т1А) | А > 0}, (3.29)
рга+1 = argшin{2|р — рп|2 — а(р, д(гуга) — 2т2р) | р > 0}; (3.30)
второй полушаг (основной) по прямым переменным
wra+1 = argшin{2^ — w”'|2 + а((Ага+1,/^)) + (рга+1,д^))) | w € Ш0}.
2 (3.31)
Двойственный экстрапроксимальный метод:
первый полушаг (прогнозный) по двойственным переменным
Лп = argшin{2|А — Ап|2 — а(А, /^п) — 2Т1А) | А > 0},
рп = argmin{2|р — рп|2 — а(р,д^га) — 2Т2р) | р > 0}; (3.32)
шаг по прямым переменным
wra+1 = argшin{2|w — w”'|2 + а((Ап,/(w)) + (рга,д^))) | w € Ш0}; (3.33) второй полушаг (основной) по двойственным переменным
Ага+1 = argшin{2|А — Ап|2 — а(А, /^га+1) — 2Т1А) | А > 0},
рга+1 = argmin{2|р — рп|2 — а(р,д^га+1) — 2Т2р) | р > 0}. (3.34)
В работе [18] доказана монотонная по норме пространства прямых и двойственных переменных сходимость этих методов к одному из решений задачи при наличии некоторых требований на исходную информацию задачи. А именно, требуется выпуклость основных элементов задачи, условие Липшица на функции /^),д^) и требуется выбирать длину шага а > 0 из некоторого фиксированного интервала.
4. Оедловое экстремальное отображение
Рассмотрим систему в основе которой лежит седловое экстремальное отображение. На базе этого отображения можно сформулировать достаточно много разнообразных систем, которые можно рассматривать как математические модели для различных ситуаций. Рассмотрим одну из таких систем [23],[24]
w* € Ащшт{(А*, Т/(w)) | g(w) < ТЬ^*), w € Ш}, (4.1)
(р — А*,д^*) — ТЬ^*)) < 0, р > 0. (4.2)
Здесь /^),д^)- векторные функции, каждая компонента которых выпуклая скалярная функция, 6^)- выпуклая вверх векторная функция /Н € Я™1 ,д^),Ь^) € Я™2, А € Я^1, р € Я^2, w € Ш С Яп. Т
- матрица, размерности которой согласованы с соответствующими переменными. В рассматриваемой задаче при некотором фиксированном значении параметра Т требуется выбрать векторы весов А = А* > 0 и w = w* > 0 так, чтобы отвечающий им оптимум w = w* удовлетворял вариационному неравенству (4.2). Предполагается, что в выпуклом регулярном случае решение этой задачи, т.е. вектор w* € Ш, А* > 0 существует.
Задача (4.1) при фиксированных значениях параметров А = А*^ = w* представляет собой задачу выпуклого программирования, поэтому естественно ввести Функцию Лагранжа
Я(А*,и*,р^) = (А*,Т/Н) + (р,дМ — ТЬ(и*)), р > 0,w € W.
Функция Ц(А*, и*,р, w) - выпукла-вогнутая относительно свои переменных р > 0, w € Ш. Как правило такие функции имеют седловую точку, которая определяется системой неравенств
(А*,Т/(w*)) + (р,дМ — ТЬ(и*)) <
< (А*,Т/(w*)) + (р*,дК) — ТЬ(и*)) <
< (А*,Т/(w)) + (р*,дИ — ТЬ(и*)) (4.3)
для всех р > 0, w € Ш. Систему полученных неравенств можно перепи-
сать в виде
w* € Argшin{(A*,T/(w)) + (p*,g(w) — ТЬ(и*)), w € Ш}, (4.4)
(р — р*,д^*) — ТЬ(и*)) < 0, р > 0. (4.5)
Эта система каждой паре векторов А*,и* ставит в соответствие пару р*^*. Таким образом, задача (4.4),(4.5) определяет точечно-множественное отображение, где каждому А, и отвечает прямое и двойственное
решение задачи выпуклого программирования. Всегда можно предполагать, что существует неподвижная точка этого отображения. Если мы хотим вычислить эту неподвижную точку, то тогда очевидно должны сформулировать следующую задачу
w* € А^шш{(А*,Т/^)) + (А*,дИ — ТЬ^*)), w € Ш}, (4.6)
(р — А*,д^*) — ТЬ^*)) < 0, р > 0. (4.7)
Сопоставляя (4.1),(4.2) и (4.6),(4.7), можно видеть, что отличие первой системы от второй состоит в том, что задача минимизации первой системы при наличии ограничений во второй системе, заменена на эквивалентную задачу, записанную через функцию Лагранжа. Другими словами, обе системы эквивалентны.
Система (4.1),(4.2) представляет собой достаточно общую конструкцию, которая содержит в себе целый букет разнообразных задач и моделей. Эта система особенно привлекательно тем, что включает в себя седловые игры двух и более игроков, последнее обстоятельство придает ей специальный интерес. Итак рассмотрим случай седловой игры двух лиц. С этой целью введем следующие обозначения:
w =
(х:)-А=(!:)./ «=( /а) д«=(йй) т=(1,1:).
0
и Ь(х) = (Ь1(ж1), Ь:(х:))т, где /1,/: - единичные матрицы размеров соответственно, т, + т, и т: + т:. Нетрудно проверить, что с помощью введенных обозначений система (4.6),(4.7) в пространстве переменных Ш = X, х X: может быть записана в виде
(/* 7*) ( 0 /1 ) ( /1(х1) ) +
{11 ЛЧ /: 0 ( I /:(х?:) у1 +
+(/*,/*) {() — (011)(Ь1^!!
1 :; I \д:(х:^ V 7: 0 / V Ь:(х:)
<
< (/*,/*)
0 /1 /: 0
+
+(/ * •/* Н( дй))—(
(/1(х1) ^
V /:(х:( )
0 /1 ) ( Ь1(х1)
/: 0 у V Ь:(х *)
(/‘ -/ * •/:—/* >{( д^Е
0 /1 /20
ЫХ!)
Ь:(х :)
0,
(4.8)
Выполнив векторно-матричные операции в (4.8), получим скалярные неравенства, которые верны для всех х € Х1 ,х: € X: и /1 > 0,/: > 0.
и
Затем рассмотрим эти неравенства последовательно в точках ж,, ж: и х1,х:. Учитывая сепарабельную структуру функций образующих эти неравенства, можно видеть, что они распадаться на независимые неравенства вида
(/2,/1(х1)) + (/ *,д1(х1) — Ь:(ж 2)) < (/2,/1(х1)) + (/ *,д1(х1) — Ь:(ж :)),
(/ *, Н(ж 2)) + (/2,д:(х :) — Ыж1)) < (/ *, У1:(х:)) + (/2,д:(х:) — ь1(х1))
для всех ж, € Х1,х: € X: и соответственно
(/1 — /, ,д1(ж1) — Ь:(х :)) < 0, /1 > 0,
(/ : — / *, д :(ж :) — &1 (ж1)) < 0, / : > 0.
для всех /1 > 0, ж : > 0. Полученную систему неравенств в свою очередь можно представить в форме
ж * € А^шт{(/ *, /1 (ж 1)) | д1(ж1) < Ь:(ж *), Ж1 € Xl},
(/1 — /1,д1 (ж1) — Ь:(ж:)) < 0, /1 > 0,
ж * € А^шт{(/ *,/:(ж :)) | д:(ж :) < 61 (ж1), ж : € X:},
(/ : — / *, д :(ж :) — &1 (ж1)) < 0, / : > 0. (4.9)
Для задач выпуклого программирования полученной системы введем функции Лагранжа
^1 (/*, ж *, /1, ж1) = (/ 2,/1(ж1)) + (/1, д1 (ж1) — Ь:(ж *)), ж1 € Xl,/l > 0,
(4.10)
Я:(/ :, ж :, /*,ж1) = / *,/:(ж:)) + (/ :,д :(ж:) — Ь, (ж1)), ж: € X:,/l > 0, (4.11)
тогда в терминах этих функций систему (4.9) можно представить в
более компактном виде - седловой игры двух лиц [24]
/1 ,ж1 € Агё8а1{Я1(/ 2,ж:,/1,ж1), ж1 € Xl,/l > 0},
/ 2,ж : € А^1{£ :(/1,ж:,/ *,ж,), ж : € X:,/l > 0}, (4.12)
где символ ArgSd1 обозначает множество седловых точек соответствующей функции Лагранжа относительно собственных переменных при фиксированных параметрах. Эта игра порождает седловое отображение множества Xl, Дт, X:, Дт в себя.
Задачи (4.9) или (4.12) формулируются относительно прямых ж,, ж : и двойственных переменных /1, / . В ситуациях экономического моделирования двойственные переменные, как правило, интерпретируются как цены или оценки. Если учесть, что любые материальные потоки в экономических системах всегда сопровождаются финансовыми или
ценовыми потоками, то нетрудно видеть, что седловые игры могут представлять полезный инструмент для описания материальных и финансовых потоков одновременно. В этом контексте приведем в качестве примера равновесную модель кредитного рынка.
4.1. Модель равновесного кредитного рынка
Модель [25] представляет собой систему задач оптимизации, которая описывает поведение двух макро-игроков: заемщика и кредитора. Принятие решений каждого из них описывается задачей выпуклого программирования, а балансирование принятых решений представлено вариационными неравенствами или что то же самое, линейными задачами оптимизации. Модель имеет вид
ж * Є А^шах{51 (ж) + (1 + г * )М (ж) | д(ж) < у *, х Є X}, (4.13)
у * Є А^шах{52 (у) + (1 *,у) | (т,у) < М (ж * ),у Є У}. (4.15)
Здесь £1(ж),£:(у),М(ж) - выпуклые вверх (вогнутые) функции для ж € X, у € У, где X С Я”, У С Ят- выпуклые замкнутые множества. Первые две функции описывают планируемую прибыль участников ситуации, последняя - заемные средства, взятые в виде кредитов. д(ж)
- выпуклая вниз функция, с помощью которой формируются балансы технологического сектора. г * > 0 - процентная ставка или цена кредита, базовый параметр модели от значения которого зависит ненасыщенный спрос и соответственно равновесное состояние системы. Системы близкие к (4.13)-(4.16) рассматривались в [23],[24].
Задачи (4.13) и (4.15) описывают процесс принятия решений заемщиком и кредитором. Найденные прямые решения, а именно, величины ж *, у * используются для формирования балансов друг у друга. Они присутствуют в балансах (4.14) и (4.16). Кроме того, в процессе принятия решений участники вырабатывают так называемые двойственные решения, а именно, величины / * € Ят, г * € Я+, где , Я+ -положительные ортанты. С помощью этой информации они влияют на целевые функции друг друга и следовательно на процесс принятия решений. Вектор / * > 0 формирует целевую функцию (4.15), а число г * > 0 по своему содержательному смыслу не должно вырождаться в ноль, поскольку целевая функция задачи (4.15) предположительно обладает свойством ненасыщаемости. Это значит, что максимум задачи всегда лежит на границе множества и г* как множитель Лагранжа, отличен от нуля. Фиксированный вектор т > 0 - это вектор рыночных цен с помощью которых покупается вектор ресурсов у € У.
(1 - 1 *,д(ж*) - у *) < 0, 1 > 0,
(4.14)
(г — г *)((т,у*) — М(ж *)) < 0, г > 0.
(4.16)
Заметим, что взаимодействие двух участников ситуации происходит по схеме: кредитор передает заемщику вектор ресурсов у * и процентную ставку r* > 0, а заемщик передает кредитору вектор множителей Лагранжа (внутренних цен) l*, с помощью которого кредитор формирует свою функцию прибыли для участия в проекте и величину необходимого кредита M (ж*). В этой схеме двойственные вектора l * и r играют роль обратных связей, которые обеспечивают равновесное состояние системы (4.13)—(4.16).
4.2. Методы решения сЕдловых игр двух лиц
Методы экстрапроксимального типа рассмотренные ранее применимы для решения задач вида (4.6),(4.7). Нетрудно видеть, что формулы методов для решения этих задач имеют вид [23]:
Двойственный метод
Лп = п+(Лп + a(g(wn) - Tb(wn)),
wn+1 € argmin{1/2|w — wn|2 + aL(w, An) | w € W},
Лга+1 = п+(Лп + a(g(wn+1) — Tb(wn+1)). (4.17)
Прямой метод
Wn € argmin{1/2|w — wn|2 + aL(w, Лп) | w € W},
Лга+1 = п+(Лп + a(g(wn) — Tb(wn)),
wn+1 € argmin{1/2|w — wn|2 + aL(w, Лга+1) | w € W}. (4.18)
Здесь размерности матриц и векторов, вообще говоря, различны, но предполагается, что они согласованы между собой так, что все матрично-векторные операции корректны. В предположении выпуклости функций и множеств, формирующих задачу и при некотором ограничении на длину шага а > 0 доказана сходимость этих процессов к равновесному решению исходной задачи, включая, в частности модели рассмотренные здесь отдельно.
Список литературы
1. Антипин А. С. О сходимости и оценках скорости сходимости проксимальных методов к неподвижным точкам экстремальных отображений / А. С. Антипин // Журн. вычисл. матем. и матем. физ. — 1995. — Т. 35. — № 5. — С. 688-704.
2. Antipin A. S. Gradient approach of computing fixed points of equilibrium problems / A. S. Antipin // Journal of Global Optimization. — 2002. — Vol. 24. — №.3. — С. 285-309.
3. Васильев Ф. П. Методы оптимизации / Ф. П. Васильев. — М.: Факториал Пресс, 2002.
4. Антипин А. С. Управляемые проксимальные дифференциальные системы для решения седловых задач / А. С. Антипин // Дифференциальные уравнения. — 1992. — Т. 28. — № 11. — С. 1846-1861.
5. Антипин А. С. Экстраполяционные методы вычисления седловой точки функции Лагранжа экстремальных отображений / А. С. Антипин // Журн. вычисл. матем. и матем. физ. — 1986. — Т. 1. — № 1. — С. 150-151.
6. Корпелевич Г. М. Экстраградиентный метод для отыскания седловых точек и других задач / Г. М. Корпелевич // Экономика и матем. методы. — 1976. — № 12. — С. 747-756.
7. Антипин А. С. Итеративные методы прогнозного типа для вычисления неподвижных точек экстремальных отображений / А. С. Антипин // Известия вузов. Математика. — 1995. — № 11. — С. 7-27.
8. Aubin J. P. Set Valued Analysis / J. P. Aubin, H. Frankowska. — Boston etc.: Birkhauser, 1990.
9. Антипин А. С. Равновесное программирование: проксимальные методы / А. С. Антипин // Журн. вычисл. матем. и матем. физ. — 1997. — T. 37. — № 11. — С. 1327-1339.
10. Антипин А. С. К построению общей теории равновесных и игровых задач / А. С. Антипин // Труды XIII Байкальской международной школы-семинара. Том 1. Математическое программирование. — Иркутск, 2005. — С. 3-35.
11. Antipin A. S. Equilibrium programming problem: prox-regularization and prox-methods / A. S. Antipin // Recent Advances in Optimization. Lecture Notes in Economics and Mathematical Systems. — Springer. 1997.
12. Антипин А. С. Экстрапроксимальный метод решения равновесных и игровых задач / А. С. Антипин // Журн. вычисл. матем. и матем. физ. — 2005. — T. 45. — № 11. — P. 1969-1990.
13. Antipin A. S. Extra-proximal methods for solving two-person nonzero-sum games /
A. S. Antipin // Mathematical Programming. Series B. — 2009. — Vol. 120. — № 1. — P. 147-177.
14. Булавский В. А. Квазилинейное программирование и векторная оптимизация /
B. А. Булавский // ДАН СССР. — 1981. — Т. 257. — № 4. — С. 788-791.
15. Гольштейн Е. Г. Модифицированные функции Лагранжа / Е. Г. Гольштейн, Н. В. Третьяков. — М.: Наука, 1989.
16. Коннов И. В. Двойственный подход для одного класса смешанных вариационных неравенств / И. В. Коннов // Журн. вычисл. матем. и матем. физ. — 2002. — T. 42. — № 9. — С. 1324-1337.
17. Коннов И. В. Методы двойственного типа для обратных задач оптимизации и их обобщений / И. В. Коннов // Доклады Академии Наук. — 2004. — Т. 395. — № 6. — С. 1-3.
18. Антипин А. С. Многокритериальное равновесное программирование: экстра-проксимальные методы / А. С. Антипин // Журн. вычисл. матем. и матем. физ. — 2007. — T. 47. — № 12. — С. 1998-2013.
19. Дубов Ю. А. Многокритериальные модели формирования и выбора вариантов систем / Ю. А. Дубов, С. И. Травкин, В. Н. Якимец. — М.: Наука, 1986.
20. Жуковский В. И., Жуковская Л. В. Риск в многокритериальных и конфликтных системах при неопределенности / В. И. Жуковский, Л. В. Жуковская. — М.: Едиториал УРСС, 2004. — 272 с.
21. Zlobec S. Stable Parametric Programming / S. Zlobec. — Dordrecht etc.: Kluwer Acad. Publ., 2001.
22. Rockafellar R. T. Variational analysis / R. T. Rockafellar, R. J. — Wets. Springer, Berlin etc.: Publ., 1998.
23. Антипин А. С. Методы решения систем задач выпуклого программирования / А. С. Антипин // Журн. вычисл. матем. и матем. физ. — 1987. — T. 27. — № 3. — С. 368-376.
24. Антипин А. С. О моделях взаимодействия предприятий-производителей, предприятий-потребителелй и транспортной системы / А. С. Антипин // Автоматика и телемеханика. — 1989. — № 10. С. 105-113.
25. Антипин А. С. О равновесной модели кредитного рынка: постановка задачи и методы решения / А. С. Антипин, О. А. Попова // Журн. вычисл. матем и матем физ. — 2009. — Т.49. — № 3. — C. 465-481.
A. S. Antipin
Equilibrium programming: models and solution methods
Abstract. The concept of equilibrium programming is considered. It includes itself complicated systems of optimization problems, in particular, n-person games with Nash equilibrium, equilibrium and multicriteria equilibrium problems, Pareto-optimal multicriteria problems, saddle point two-person games with saddle point for equilibria. Extrapro-ximal and extragradient methods for solving these problems are discussed. The equilibrium economic models formulated are offered on the basis of equilibrium programming the concept.
Keywords: equilibrium programming, equilibrium solutions, saddle points.
Антипин Анатолий Сергеевич, доктор физ.-мат. наук, профессор, главный научный сотрудник, Вычислительный Центр РАН, 119333, Москва, ул. Вавилова 40, ВЦ РАН, тел.: (499) 135-81-61,
Anatoly Antipin, Doctor, Professor, Principal Researcher, Computing Center of RAS, 19333, Russia, Moscow, Vavilov str., 40,
Phone: (499) 135-81-61, ([email protected])