УДК 021.8 + 025.1 ББК 78.34
ОПТИМАЛЬНОСТЬ СОГЛАСОВАННЫХ МЕХАНИЗМОВ ФУНКЦИОНИРОВАНИЯ В АКТИВНЫХ СИСТЕМАХ
Еналеев А. К.1
(Учреждение Российской академии наук Институт проблем управления РАН, Москва)
Исследуются механизмы функционирования в двухуровневых активных системах, в которых на процедуры планирования и системы стимулирования накладываются дополнительные условия согласования предпочтений активных элементов с предпочтениями центра. При этих условиях обеспечивается выполнение планов и сообщение достоверной информации (неманипулируемость). Определяются достаточные условия оптимальности согласованных механизмов.
Ключевые слова: процедура согласованного планирования, принцип открытого управления, достоверность информации, выполнение плана, согласование интересов, синтез оптимального механизма.
1. Введение
Идея согласования интересов элементов иерархически организованных систем имеет давнюю историю. Не претендуя на указание самых первых работ по данной теме, отметим, что эта идея подробно обсуждалась еще в [10]. В теории активных систем идея согласования наиболее обстоятельно была рассмотрена в [1], в частности, предложены принцип совершенного согласования в задачах планирования и соответствующая ему
1 Анвер Касимович Еналеев, кандидат технических наук, старший научный сотрудник ([email protected]).
процедура открытого управления, обеспечивающая сообщение активными элементами достоверной информации. Первые результаты исследования оптимальности согласованных механизмов функционирования активных систем для случая полной информированности центра о моделях активных элементов были опубликованы в работах [3, 5]. Для случая неполной информированности центра в [2] доказана оптимальность принципа открытого управления при заданной системе стимулирования активного элемента, а в [4] исследована задача синтеза оптимального механизма в случае «сильных штрафов» за отклонение состояния активного элемента от плана. В работе [8] доказана оптимальность согласованных механизмов в случае, когда величина штрафа за отклонение состояния от плана ограничена фиксированной величиной.
В настоящей работе обобщены результаты работы [3, 5, 8], даны достаточные условия оптимальности согласованных механизмов функционирования активных систем для случаев полной и неполной информированности центра. Условия согласованности механизмов функционирования представлены путем введения дополнительных ограничений на выбор центром процедур планирования. Эти условия обеспечивают выполнение активными элементами назначаемых им планов и сообщение в центр достоверной информации. Получены решения задач синтеза оптимальных механизмов функционирования для ряда важных случаев, когда выполняются условия согласованности.
2. Модель и постановка задачи
Модель рассматриваемой активной системы описана в [1, 8], поэтому здесь ограничимся сжатым представлением модели. Пусть активная система состоит из центра и активного элемента (АЭ).
Обозначим целевую функцию центра как Ф(х, у, г) и предположим, что Ф(у, у, г) > Ф(х, у, г) > 0, где функция Ф(у, у, г) непрерывна и строго квазивогнута по у при всех г е А. Здесь х -назначаемый центром план; х е X- множество допустимых планов; у - выбираемое активным элементом состояние; у е У -
множество допустимых состояний; r - параметр, характеризующий систему; r е A - множество допустимых значений параметра. Далее для простоты примем X = Y. Предположим, что множества X, Y, так же как и A, являются ограниченными замкнутыми множествами. Обозначим fx, y, r) целевую функцию АЭ. Будем предполагать, что план x назначается центром в соответствии с некоторой процедурой планирования x = п(.), где п(.) отображает множество A в множество X. Центр может назначать целевую функцию АЭ в рамках определенных ограничений: fix, y, r) е F. Здесь F обозначает заданное множество допустимых целевых функций (систем стимулирования).
Совокупность процедуры планирования x = п(.) и целевой функции АЭ f(., ., r) составляет механизм функционирования / = {п(.), f(., ., r)}. В теории активных систем, например [1, 2, 3], процедуру планирования принято называть также законом управления.
Введем предположения об информированности в рассматриваемой активной системе.
Активному элементу известно значение параметра r, а центру известно только множество A допустимых значений этого параметра. Предполагается также, что при заданном механизме функционирования / активный элемент сообщает центру оценку р параметра r, р е A.
Пусть задан механизм тогда функционирование рассматриваемой активной системы описывается следующим образом: АЭ сообщает оценку р параметра r, затем в соответствии с процедурой планирования п(.) назначается план x = п(р), затем АЭ выбирает состояние y, стремясь максимизировать по y свою целевую функцию f(x, y, r).
Обозначим функцию предпочтения активного элемента j (x, r ) = max f (x, y, r ) и функцию предпочтения центра
yeY
Y(x, r) = min F(x, y, r),
yeZ ( x,r )
где Z(x, r) - множество рациональных стратегий активного элемента при выборе состояния y (определение используемого в
данной работе множества рациональных стратегий Z(x, r) приведено ниже).
Здесь и далее для простоты записей предположим, что соответствующие операции max и min определены.
Для заданного механизма функционирования / определим показатель его эффективности
(1) K (m ) = min [min Y(p(p), r)/Ye(r)],
re A p e
где R(r) - множество рациональных стратегий АЭ при выборе им сообщения (определение множества R(r) приведено ниже), Y^r) - заданная нормирующая функция. В качестве нормирующей функции могут быть могут быть выбраны, например, следующие функции: Ye (r) = max Y (x, r), либо
xeX
Ye (r) = max F( x, x, r), либо Ye (r) = const > 0.
xeX
Далее будем предполагать выполнение «слабого условия благожелательности АЭ» [8], при котором множества рациональных стратегий АЭ принимают следующий вид: {x}, если x e Arg max f (x, y, r),
yeY
Z (x, r) =
{r }, если r e Argmax j(p(p), r),
Arg max f (x, y, r) в противном случае,
yeY
R(r ) =
eA
Argmax j(p(p), r) в противном случае.
eA
Содержательно это условие означает, что если для АЭ сообщение достоверной информации является рациональной стратегией, то эта стратегия единственна, и, соответственно, если стратегия выполнения плана является рациональной, то она также единственна. Нетрудно убедиться, что «слабое условие благожелательности» выполняется, если справедливо «условие благожелательности», используемое в работах [6, 7].
Особый интерес представляют собой механизмы, которые обеспечивают выполнение планов и сообщение достоверной информации (неманипулируемость), т.е. (2) 2 (х, г) = {х},
(3) R(r) = {r}.
Такие механизмы ^пр в теории активных систем принято называть правильными. Заметим, что для правильных механизмов ^пр выражение для критерия эффективности существенно упрощается (по сравнению с (1))
(4) K (m ) = шш[Ф(я:(r),ж(r),r)/Ys(r)].
F re A
Обозначим Мпр множество правильных механизмов (то, что множество Мпр может быть непусто, подтверждается, например, результатами работы [8]),
В теории активных систем ставится следующая общая задача синтеза оптимального механизма функционирования ^ :
(5) K (m *) = max K (m),
meM
где М- некоторое заданное множество механизмов.
Итак, пусть задано некоторое множество М такое, что
мnмпр
Задача. Охарактеризовать множества допустимых механизмов М, для которых выполняется K(m*) = max K(m) = max K(m),
meM meM пмпр
т.е. оптимальный механизм на множестве М принадлежит множеству правильных механизмов,
(6) m * e м п мпр.
Ниже будут найдены и исследованы достаточные условия выполнения (6), характеризующие множество механизмов М.
Забегая вперед, скажем, что эти условия будут представлять собой некоторые условия согласованности механизмов функционирования.
3. Оптимальность согласованных механизмов при полной информированности центра
При полной информированности центру известно значение параметра r, тогда критерий эффективности механизма принимает вид
Управление большими системами. Выпуск 33 K (m ) = Y(p(r), r) = min Ф(р(r), y, r),
yeZ (p ,r)
а для правильного механизма K (тщ ) = Ф(р(r),p(r), r).
Оптимальные процедуры планирования. Множество правильных механизмов Мпр при полной информированности характеризуется следующим условием: план должен быть «выгодным» для АЭ, т.е.
fn, у, r) <f(n, n, r). В этом случае будет выполняться (2).
Обозначим множество выгодных для АЭ планов, а значит планов, согласованных с интересами АЭ,
P(r) = {x e X \f (x, y, r) < f (x, x, r), "y e Y}.
Таким образом, центр, назначая планы из множества P(r), некоторым образом согласовывает свои интересы с интересами АЭ. Это множество будем называть множеством согласованных планов.
Введем в рассмотрение множество всех возможных рациональных стратегий АЭ Z(r) = U Z(x, r). Очевидно, что
xeX
P(r) i Z(r).
Таким образом, задача определения условий оптимальности согласованного механизма сводится к нахождению такого механизма для которого выполняется условие
(7) K(m) = max min Ф(x, y, r) = max Ф(x, x, r).
xeX yeZ (x,r) xeP(r)
Утверждение 1. Достаточным условием выполнения (7) является выполнение
(8) P(r) = Z(r).
Соотношение (8) означает, что множество согласованных планов максимально «широко», т.е. включает в себя все возможные рациональные стратегии АЭ. Принимая во внимание этот факт, систему стимулирования, для которой выполняется (8), будем называть максимально согласованной, условия (8) -условиями максимального согласования, а процедуру вычисления оптимального плана x* = argmax Ф(x, x, r) - процедурой
xeP( r )
оптимального согласованного планирования.
Непосредственная проверка условия (8) в общем случае представляет достаточно трудную задачу. Поэтому хотелось бы иметь представление о свойствах целевых функций АЭ, для которых обеспечивается выполнение условий максимальной согласованности (8).
Такие свойства описывает следующее утверждение. Теорема 1. Для максимальной согласованности (8) достаточно выполнения неравенства (9) Др, р, г) + Ах, у, г) >_Дх, р, г) + Др у, г) для "р, у е 2(г), "х е X.
Доказательство теоремы 1 приведено в приложении. Заметим, что утверждение теоремы тем более справедливо, если
(9) выполняется для "р, у, х е X. В этом случае проверка достаточных условий максимальной согласованности существенно упрощается.
Отметим, что в условиях согласованности (8) или (9) не используются свойства целевой функции центра. Эти условия характеризуют только свойства целевой функции АЭ. Целевые функции, удовлетворяющие условиям теоремы 1, назовем сильно согласованными.
Таким образом, показано, что при сильно согласованной целевой функции АЭ согласованное планирование является оптимальным и АЭ выбирает состояния, совпадающие с планом.
Предположим теперь, что целевая функция АЭ представима в виде
(10) А(х, у, г) = Н(у, г) + а(х) -х(х, у),
где Н(у, г) - функция, отражающая величину дохода или затрат АЭ при выборе состояния у; функцию а(х) можно интерпретировать как поощрение за величину («напряженность») плана, а Х(х, у) - функция штрафов за отклонение состояния у от плана х, причем
(11) х(х, у) > о, х(у, у) = 0.
В этом случае справедливо следствие из теоремы 1.
Следствие 1. Для максимальной согласованности достаточно выполнения неравенства «треугольника»
(12) х(х, у) < х(х, п) + х(п, у)
для "к, у е 2(г), "х е X.
По аналогии, функции штрафов, удовлетворяющие условию (12), назовем сильно согласованными функциями штрафов.
В теореме 1 и ее следствии определены достаточные условия оптимальности процедур согласованного планирования. Определим теперь условия оптимальности сильно согласованных функций стимулирования (целевых функций АЭ).
Оптимальные системы стимулирования.
Пусть задана сильно согласованная целевая функция /(х, у, г). Определим множество ^ (г) допустимых целевых функций АЭ Дх, у, г) следующего вида:
Р\г) = {Дх,у, г) I*х,у, г) - .Дх,у', г) </(у,у, г) - /(у,у', г),
где х,у'е X,у е Р (г)}. Здесь Р*(г) = {х е XI/(х, у, г) </(х, х, г) "у е У } - множество согласованных планов для целевой функции АЭ / (х, у, г).
Теорема 2. Сильно согласованная целевая функция /(х, у, г) оптимальна на множестве ^ (г).
Доказательство теоремы приведено в приложении. В случае, когда целевые функции АЭ имеют вид (10), (11) и функция штрафа х (х, у) сильно согласована, т.е. удовлетворяет неравенству «треугольника» (12), при "р, у, х е У, У = X, справедливо важное
Следствие 2. Функция штрафа х (х, у) оптимальна на множестве функций штрафов
^ = {с(х, у) \%(х, у) - с(х, у) < с*(у, у), где х, у, у е У}.
Рассмотрим произвольную целевую функцию _Дх, у, г), достигающую своих экстремумов по х е X при всех у е У, г е А, и определим для нее показатель максимального роста при изменении состояния от у до у :
(13) иг (у, у, г) = тах[/(х, у, г) - /(х, у, г)].
J хеХ
Покажем, что функция и^ (у, у, г) обладает свойствами
сильно согласованной функции штрафа АЭ. Для этого проверим выполнение неравенства (12).
Пусть Ы/. (у, у, г) = /(х*, у, г) - /(х*, у, г^ где / - план, при
котором достигается максимум в выражении (13). Рассмотрим цепочку соотношений
Ыг (х, 2, г) + м. (2, у, г) = тах[ / Ц, 2, г) - / (г, х, г)] +
-1 -1 геХ
+ тах[/ (г, у, г) - / (г, г, г)] > / (х*, 2, г) - / (х*, х, г) +
1еХ
+/(х*, у, г) - / (х*, 2, г) = / (х*, у, г) - / (х*, х, г) = = тах[ / Ц, у, г) - / Ц, х, г)] = ыг (х, у, г),
геХ -1
т.е. для Ы/ (у, у, г) выполняются свойства (11), (12).
По аналогии с определением показателя максимального роста целевой функции АЭ введем в рассмотрение показатель максимального роста функции штрафов при изменении состояния от у до у :
(14) ы (у,у) = тах[%(х,у)-%(х,у)].
хеХ
Показатель максимального роста функции штрафов ых (у, у) также удовлетворяет условиям (11), (12), т.е. представляет сильно согласованную функцию штрафа (доказательство этого утверждения аналогично доказательству свойств показателя ы1 (у, у, г)).
Отметим, что если целевые функции АЭ имеют вид (11), то
Ы/ (у, у, г) = ы% (у, у) .
Таким образом, путем преобразования (14) для любой функции штрафа х(х, у) можно построить соответствующую ей сильно согласованную функцию штрафа ы% (у, у) .
Заметим, что если функция штрафов х(х, у) сильно согласована, то она совпадает со своим показателем максимального роста, х(х, у) = Ых(х, у).
Действительно, так как х(х, у) - сильно согласованная функция штрафа, то из (11) следует соотношение х(2, у) - х(2, х) < х(х, у), причем равенство в нем достигается при 2 = х.
Таким образом, сильно согласованную можно определить как функцию штрафов, совпадающую со своим показателем максимального роста.
Следствие из теоремы 2 в таком случае можно переформулировать следующим образом: если функция штрафов х (x, у) сильно согласована, то она оптимальна в классе всех функций штрафов х(х, у), имеющих при всех x, y е Y не большее значение показателя максимального роста, чем х (x, у), т.е. Ux(x, у) < х*(х, у).
4. Оптимальность согласованных механизмов при неполной информированности центра
Оптимальные процедуры планирования.
В [2] показано, что оптимальная процедура планирования содержится в множестве процедур открытого управления.
По определению процедура открытого управления пОУ(.) задается условием «совершенного согласования» [2]: (15) Vpe A: j(pОУ (р),р) = max j(x,p),
xeXc
где Xc - устанавливаемое центром замкнутое подмножество множества X, не зависящее от сообщаемой АЭ оценки p.
Заметим, что условия совершенного согласования являются более «жесткими» по сравнению с введенными выше условиями сильной согласованности (9), если множество Xc достаточно «широко», т.е., например, Xc = X.
В [2] доказано, что процедура открытого управления стимулирует АЭ сообщать достоверную информацию p = r, так как Vp, r е A: j(noy(p), r) < j(noy(r), r).
Отсюда следует, что для процедур открытого управления функция предпочтения центра имеет вид Y(n (r), r).
Из этого свойства, а также из (1), вытекает
Утверждение 2. Для процедуры открытого управления, критерий эффективности (1) имеет вид
K (m) = min[F(p ОУ (r), p ОУ (r), r)/ Y (r)].
reA
Оптимальные системы стимулирования.
Дальнейшее изложение потребует дополнительных предположений о свойствах модели АЭ.
Во-первых, будем предполагать, что У = X = [хн, хв], А = [гн, гв], т.е. множества допустимых состояний, планов и значений параметра г представляют собой отрезки на числовой оси.
Во-вторых, целевая функция АЭ имеет вид (10), (11), где И(у, г) = -£(у, г). Функция £(у, г) представляет собой функцию затрат АЭ, а s(y, х) = а(х) - х(х, у) определим как систему стимулирования, которую центр может выбирать из заданного множества допустимых систем стимулирования.
В качестве множества допустимых систем стимулирования примем
5 = ^(у, х) | 0 < а(х) < g,х(х,у') -х(х,у) < мх(у,у'), х,у,у'еУ}, где g - заданное положительное число, а мх(у,у') - заданный показатель максимального роста функции штрафов за невыполнение плана.
Предположим, что функция затрат £(х, г) дважды дифференцируема по х, дифференцируема по г и
сх (х, г) > 0, с: (х, г) > 0, с; (х, г) < 0, с: (х, г) < 0
при всех х е Х, г е А.
Первые два неравенства указывают на возрастание функции затрат и ее выпуклость соответственно. Третье неравенство характеризует монотонность функции затрат по параметру г. Четвертое неравенство соответствует хорошо известным в микроэкономике условиям Спенса-Мирлиса [12] и характеризует упорядоченность АЭ по возможным значениям параметра г, причем с увеличением г происходит снижение затрат и темпа роста затрат с увеличением х.
Поскольку оптимальной процедурой планирования при произвольной фиксированной целевой функции АЭ является процедура открытого управления, то определение оптимального механизма сводится к нахождению оптимальной системы стимулирования 5 (у, х) = а (х) - х (х, у),
Таким образом, для рассматриваемого случая неполной информированности центра ниже будет исследована задача (5) синтеза оптимального механизма / на множестве
М = {/ | 5(у, х) е 8, х = п(р), х, у е X, р е А}, где п(р) - кусочно-непрерывные функции, определенные на множестве А и принимающие значения в X .
Лемма 1. Множество согласованных планов Р(г) является выпуклым, если Ыу, г) вогнутая функция на отрезке У, а функция штрафов удовлетворяет условиям (11), (12).
Доказательство леммы 1 приведено в приложении.
Лемма 2. Пусть функция затрат АЭ удовлетворяет условиям Спенса-Мирлиса, а функция штрафов удовлетворяет условиям (11), (12), тогда Р(г1) с Р(г2), если г1 < г2.
Доказательство леммы 2 приведено в приложении.
Из лемм 1 и 2 следует, что множество согласованных планов Р(г) при сделанных предположениях о свойствах функции затрат представимо в виде отрезка Р(г) = [хн, хР(г)], где X (г) -неубывающая функция.
Обозначим у = у (х) - выбор состояния АЭ при плане х, т.е. у е Z(x, г). Если функция штрафов является сильно согласованной, т.е. выполнены условия (11), (12), и план хс удовлетворяет условию согласования хс е Р(г), то у* = хс, если же х й Р(г) = [хн, хР(г)], то у* е Р(г) = [хн, хР(г)].
Тогда функцию предпочтения АЭ можно записать в виде
Г с(х) - Е (х, г), если х е Р(г),
( (х, г) = < *
[с(х) - Е (х, г) - с(х, у ), если х й Р(г).
Соответственно, функцию предпочтения центра можно представить в виде
Г Ф(х, х, г), если х е Р(г),
Т (х, г) = ■< *
[Ф(х,у , г), если х й Р(г).
Заметим, что в силу предположения Ф(у, у, г) > Ф(х, у, г) имеет место Ф(у*, у*, г) > Ф(х, у*, г). Но так как у* е Р(г), то выбором плана х = у* всегда можно обеспечить выбор активным элементом состояния у , т.е. функцию предпочтения центра достаточно рассматривать в области определения х е Р(г), а
следовательно, достаточно рассматривать только те процедуры планирования п(.), значение которых принадлежит множеству
Отметим, что из принятых выше предположений о свойствах функции затрат АЭ вытекает справедливость следующего утверждения (доказательство см. в [8]).
Утверждение 3. Процедура открытого управления пОУ(г) представляет собой неубывающую функцию, принимающую значения в множестве согласованных планов P(r).
Отсюда следует, что оптимальную процедуру планирования достаточно искать на множестве неубывающих функций.
Оптимальные система стимулирования и механизм в целом.
Зафиксируем некоторое значение g показателя эффективности механизма ц. Введем в рассмотрение множество Lr всех неубывающих непрерывных функций ) таких, что
"r е A, x = жу (r) е X: Y(x, r) > gYe (r),
и множество Qr неубывающих непрерывных функций при выполнении также условия согласования x е P(r), т.е.
"r е A, x = пу (r) е P(r): F(x, x, r) > gYe (r).
Справедливо следующее утверждение [8].
Утверждение 4. Предположим, что функция F(x, x, r) непрерывна и строго квазивогнута по x, и пусть g таково, что неравенство F(x, x, r) > gY^r) разрешимо в множестве X "r е A, тогда множество всех точек (x, r), удовлетворяющих этому неравенству, можно представить в виде {(x, r) | qi(g, r) < x < qi(g, r), r е A, x е X}, где qi(g r) и q2(g r) -непрерывные функции.
Рассмотрим функции
qi(g,r) = max qi(g,p), q2_(g,r) = min qP(g,p),
r н < p < r r < p < r 6
где qP (g, p) = min{ q2 (g, p), xP (p) }.
Очевидно, что q,(g,r) и q2(g,r) - неубывающие непрерывные функции.
Справедливо также следующее утверждение (доказательство приведено в [8])
Утверждение 5. Если Qg Ф 0, то
1) q,(g,r) £ q2(g,r) при всех r е A,
2) Qg = Ng, где
Nr = {x(r) | q,(g,r) £ x(r) £ q^g,r), x(r) е Qy, r е A}.
Заметим, что Nv i Nv , если g, > g
gl g 2 1 2
Пусть gтакое, что NgФ 0. Обозначим a = q2(g,rH) .
Рассмотрим процедуру планирования
* Г a, если rн £ r £ ß P*(r) = <!- в ,
[q, (g, r), если ß < r £ r
где ß = гв, если a > q,(g, rB), либо ß определяется как решение уравнения q,(g,ß) = a, если a < q,(g,rB) .
Заметим, что по построению P*(r) является неубывающей непрерывной функцией и ее график является связным множеством. Отсюда следует, что существует функция x), обратная
к P*(r), определенная на множестве допустимых планов X за исключением, быть может, счетного числа точек, при этом ~*( x) является неубывающей.
Теорема 3. Оптимальный механизм функционирования ¡с* определяется следующими выражениями
к (m') = g *,
* Г a,если rн £ r £ ß, (16) x = p *(r) = \_ *
g [ q,(g*, r), если ß < r £ rB,
С (У) = иг (х, y),
0 при хн < х < a,
а*(х) =
j'aZ't (t,rr(t))dt при a <х<p*(rB),
при p ,(rв) < х < хв.
г
При этом показатель эффективности оптимального механизма функционирования g* удовлетворяет условию g* = max {g| QgФ 0}, откуда, в частности, следует требование выполнения неравенства a > qx(g*,rн), а величина g должна удовлетворять условию
p .(гв )
j z; (t, r;(t))dt <;
Примечание. В математических выражениях в формулировке теоремы С/ (г, )) обозначает частную производную по
первой переменной функции затрат АЭ.
Доказательство теоремы аналогично доказательству теоремы, приведенной в работе [8].
Из теоремы также получаем два следствия.
Следствие 1. <7*(х) - неубывающая непрерывная функция.
Следствие 2. Величина К(/л") = 7* не убывает с увеличением g.
В содержательных терминах теорема показывает, что для рассмотренной модели активной системы, как и в условиях полной информированности центра, выполнение планов обеспечивается применением штрафов с максимальным показателем роста, а процедура планирования конструируется таким образом, чтобы наиболее «экономично» использовался фонд стимулирования для обеспечения «выгодности» назначаемых планов.
Примерами показателя максимального роста функции штрафов являются
1) «линейная» функция
ux (x, y) = u1 (x, y) = -.
[ S2(x - y), если y < x,
где S > 0, 02 > 0;
2) «ограниченная» функция
( ) c ( ) i 0 если у =x'
ux (x, y) = u (x, y) = i
[ C(y), если y Ф x,
где C(y) > 0.
Из второго примера показателя максимального роста следует, что теорема 3, в частности, дает решение задачи синтеза оптимального механизма функционирования на множестве допустимых механизмов
M = [р | s(y, x) е S, x = п(р), x, y е X, р е A}, где 5е = [s(y, x) | 0 < a(x) < g, x(x, y) < C(y), x, y е X}, так как из x(x, y) < C(y) следует x(x, y) - x(x, y') < x(x, y) < C(y) при всех x, y, y'e Xи ux(x, y) = uC(x, y).
При C(y) = const из теоремы 3 как следствие получаем результат теоремы из [8] об оптимальном механизме при ограниченных функциях штрафов.
В [7, 9] задача синтеза оптимальной стратегии первого игрока (центра) решена для случая, когда целевая функция центра не зависит от значения неизвестного параметра r, но в гораздо более слабых предположениях о свойствах целевых функций игроков (центра и АЭ), а именно, в этих работах предполагалась только непрерывность целевых функций игроков. Полученное в [7, 9] при таких слабых предположениях решение задачи выглядит достаточно громоздким и сведено к решению серии задач поиска экстремумов целевых функций игроков на специально построенных множествах, которые могут иметь очень сложную структуру. Использование в настоящей статье ряда предположений о свойствах целевой функции АЭ: разделение целевой функции на систему стимулирования и функцию затрат, предположение о свойствах первых и вторых производных функции затрат АЭ, позволило доказать монотонность решений (утверждения 1 и 3). Эти свойства решений позволили найти в достаточно конструктивном виде решение задачи синтеза оптималь-
S1(y - x), если y > x,
ного механизма функционирования для рассмотренной модели активной системы.
5. Заключение
Полученные результаты определяют условия эффективности применения на практике механизмов с так называемым «встречным» планированием [1, 11]. Действительно, поскольку в оптимальном механизме используется процедура открытого управления, активному элементу назначается наиболее «выгодный» для него план. Зная это, АЭ может сам сообщать центру вместо значения параметра р значение этого плана, освободив тем самым центр от трудоемкого вычисления плана в соответствии с процедурой открытого управления. Это значительно облегчает реализацию оптимальных механизмов на практике. Результаты теоремы 3 дают также определенное обоснование систем стимулирования, рекомендуемых при «встречном» планировании [11].
Заметим, что в некоторых приложениях в случае необходимости дополнительного поощрения перевыполнения «встречного» плана более естественно в качестве функции стимулирования за напряженность плана использовать функцию
\о*(у), если у > х,
о (ху) = 1 ч
\о (х), если у < х.
На рис. 1 и рис. 2 проиллюстрированы примеры использования «линейных» штрафов за отклонение реализации от плана в системах стимулирования при «встречном» планировании для различных значений параметра функции штрафа ¿1.
Из рис. 1 видно, что при «слабых» штрафах система стимулирования может поощрять перевыполнение плана.
Дальнейшее развитие результатов (теоремы 3) даст возможность исследовать и решать задачи синтеза эффективных систем стимулирования при «встречном» планировании для случаев неполной (например, вероятностной) информированности, в том числе и АЭ о параметре г.
Рис. 1. Вид функции стимулирования при большом значении параметра 8 («сильный» штраф)
Рис. 2. Вид функции стимулирования при малом значении параметра 8\ («слабый» штраф)
Приложение
Доказательство теоремы 1. Покажем, что из (9) следует Z(r) с Р(г).
Предположим противное, т.е. Z(r) ё Р(г). Это означает, что АЭ для некоторого плана п такого, что п е Z(r)P(r), выберет локально-оптимальное для себя состояние у, такое что у Ф п. Так как у - локально оптимальное состояние, то у е Z(r), т.е.
А(п, у, г) > Дп, п, г). Здесь знак строгого неравенства записан в силу предположения о благожелательности АЭ.
С другой стороны, по определению множества Z(r) и того, что п е Z(r), должен найтись план х е X, при котором АЭ выберет локально-оптимальное состояние у — п. То есть должно выполняться неравенство
Ах, п, г) >Ах, у, г).
Складывая приведенные выше два неравенства, получим
А(п, п, г) + Ах, у, г) < Ах, п, г) +Ап, у, г), что противоречит предположению (9). Следовательно, предположение Z(r) ё Р(г) неверно. Таким образом, доказано, что при выполнении условия (9) имеет место Z(r) с Р(г). Отсюда, кстати, следует что Р(г) Ф 0. По определению множества согласованных планов Р(г) имеем Р(г) с Z(r), следовательно, Р(г) = Z(r). Теорема доказана.
Доказательство теоремы 2. Заметим сначала, что множество всех рациональных стратегий для целевой функции А(х,у, г) АЭ имеет вид Z*(г) = и Z*(х,г), где
Z *( x, r) = <
{x}, если x е Arg max f * (x, y, r),
yeY
Argmax f (x, y, r) в противном случае.
yeY
В силу (8) и теоремы 1 множество Z (г) совпадает с множеством согласованных планов: Z*(r) = Р*(г), так как А(х, у, г) -сильно согласованная функция.
Итак, пусть для АЭ заданы два варианта целевой функции: fx, y, r) и f (x, y, r) из множества F*(r). Покажем, что
(17) K(ß) > ад,
где K(/л) = max min Ф(x, y, r) - максимальная эффективность
xeX yeZ(x,r)
механизма функционирования для первого варианта целевой функции АЭ, K(/*) = max min Ф(x,y,r) = max Ф(x,x,r) -
xeX yeZ*(x,r) xeP* (r)
максимальная эффективность механизма функционирования для второго варианта целевой функции АЭ.
Рассмотрим сначала АЭ с первым вариантом целевой функции fx, y, r). Пусть при выборе центром некоторого произвольного плана x e X АЭ выбирает состояние y, y e Z(x, r), т.е. для всех y'e Y справедливо
(18)f(x,y, r) >fx,y', r). * * Покажем, что из yeZ (x, r) следует y e P (r), где P (r) -
множество согласованных планов для целевой функции АЭ
f(x, y, r). *
Предположим противное, т.е. y g P (r), следовательно
(19) $y'e X, f(y', y, r) >f*(y, y, r). Сложив неравенства (18) и (19), получим
(20) fx, y, r) + f (y', y, r) >fx, y', r) + f (y, y, r), или неравенство
(21) fx, y, r) - fx, y', r) > f(y, y, r) - f(y', y, r), которое противоречит предположению теоремы. Следовательно, y e P*(r). Отсюда и из F(y, y, r) > F(x, y, r) следует (17). Теорема доказана.
Доказательство леммы 1. Обозначим P множество согласованных планов:
P = {x e X |h(x) > h( y) - c (y, x), "y e Y}.
Очевидно P Ф 0, поскольку y* e P, где y* = argmaxh(y).
yeY
Предположим, что множество согласованных планов состоит из более чем одной точки.
Рассмотрим некоторое произвольное состояние y, не принадлежащее множеству согласованных планов:
(22) у е Р.
Из (22) следует, что при плане, равном у, АЭ выберет некоторое состояние (реализацию) у', неравное у, и будет выполнено неравенство
(23) к(у) < Н(у) - х(у, у).
Заметим, что в силу выполнения неравенства треугольника для функции штрафов состояние у' должно принадлежать множеству согласованных планов, т.е. у'е Р.
Предположим противное, т.е. что множество согласованных планов Р невыпукло, тогда Зу е Р и соответствующее ему
у'е Р такие, что Зу0 е Р и За, 0 < а < 1, что у = а у0 + (1 - а) у*.
Из у0 е Р следует
(24) к(у°) > к(у)-с(у, у0).
В силу с(у ,у0) > 0 справедливо
(25) Й(У) > Ъ(у) - с (у, у°).
Сложив неравенства (24) и (25) с некоторыми произвольными из отрезка а е [0, 1] весовыми коэффициентами а и 1 - а, получим
(26) ак(у0) + (1 - а Ж у) > И( у) - с (у, у0).
В силу вогнутости функции И(у) выполняется неравенство
(27) к(у) > ак( у0) + (1 - а)Н( у).
Сравнивая (26) и (27) для а = а, получим неравенство
К у) > И( у) - с (у, у),
которое противоречит неравенству (23). Полученное противоречие доказывает справедливость леммы.
Доказательство леммы 2. Множества согласованных планов для г1 и г2 можно представить в виде
Р(г0 = {х е X I -С(х, г0 > -С(у, гг) -х(у, х), "у е У], Р(г2) = {х е X I -С(х, г2) > -Оу, г2) -х(у, х), "у е У]. Покажем, что если х е Р(г1), то х е Р(г2), т.е. для " у е У из
(28) -£(х, /1) >-С(у, - С(у, х) следует
(29) (х, г2) >-С (у, г2) - С(у, х).
Заметим, что хн е /(/"1) и хн е Р(г2) в силу вогнутости и неубывания функции затрат.
Из леммы 1 следует, что существуют такие числа х (г1) и х*(/2), что
Р(Г1) = [хн, х>0] и Р(Г2) = [хн, х>2)].
Предположим противное, т.е. из (28) не следует (29), что означает 3 у такое, что у < х и
(30) -£ (х, т2) <-С (у, г2) - Х(У, х).
Заметим, что здесь условие у < х справедливо в силу того, что (х, г2) > -(у, г2) при всех у > х .
Вычтем (30) из (28) и примем у = у . Отсюда получим
(31) С(х, г2) - С (у, г2) > С(х, /1) - С (у, Г1).
Из условий Спенса-Мирлиса, (х, г) < 0, следует
С х (х, /2) - С х (х, /1) < 0,
но это противоречит (31) в силу С'х (х, г) > 0 .
Полученное противоречие доказывает справедливость леммы.
Литература
1. БУРКОВ В.Н. Основы математической теории активных систем. - М.: Наука, 1977. - 256 с.
2. БУРКОВ В.Н., ЕНАЛЕЕВ А.К. Оптимальность принципа открытого управления. Необходимые и достаточные условия достоверности информации в активных системах // Автоматика и телемеханика. - 1985. - №3. - С. 73-80.
3. БУРКОВ ВН., ЕНАЛЕЕВ А.К., КОНДРАТЬЕВ ВВ. Двухуровневые активные системы. IV. Цена децентрализации механизмов функционирования // Автоматика и телемеханика. - 1980. - №6. - С. 110-116.
4. БУРКОВ В Н., ЕНАЛЕЕВ А.К., ЛАВРОВ Ю Г. Синтез оптимальных механизмов планирования и стимулирования в
активной системе // Автоматика и телемеханика. - 1992. -№10. - C. 113-120.
5. БУРКОВ ВН., КОНДРАТЬЕВ В В. Механизмы функционирования организационных систем. - М.: Наука. 1981. -384 с.
6. ГЕРМЕЙЕР Ю.Б. Игры с непротивоположными интересами. - М.: Наука, 1978. - 327 с.
7. ГОРЕЛИК В.А., КОНОНЕНКО А.Ф. Теоретико-игровые модели принятия решений в эколого-экономических системах. - М.: Радио и связь, 1982.
8. ЕНАЛЕЕВ А.К. Оптимальный механизм функционирования в активной системе с обменом информацией // Сборник трудов «Управление большими системами». Выпуск 29. -М.: ИПУ РАН, 2010. - С. 108-127.
9. КОНОНЕНКО А.Ф. Роль информации о функции цели противника в играх двух лиц с фиксированной последовательностью ходов //ЖВМиМФ. - 1973. - №2. - С. 311-317.
10. МЕСАРОВИЧ М., МАКО Д., ТАКАХАРА И. Теория иерархических многоуровневых систем. - М.: Мир, 1973.
11. Механизмы управления: Учебное пособие / Под ред. Д.А. Новикова. - М.:ЛЕНАНД, 2011. - 192 с.
12. MAS-COLLEL A., WHINSTON M. D. GREEN J. R. Micro-economic theory. - N.Y.: Oxford Univ. Press, 1995.
OPTIMAL INCENTIVE COMPATIBLE MECHANISMS
IN ACTIVE SYSTEMS
Anver Enaleev, Institute of Control Sciences of RAS, Moscow,
Cand.Sc., chief research officer ([email protected]).
A problem of incentive compatible mechanism design is studied.
Conjoint design of a planning rule and an incentive scheme is considered. Sufficient conditions are obtained for optimality of incentive
compatible mechanisms.
Keywords: coordinated planning routine, open control principle, information reliability, plan fulfillment, coordination of interests, optimal mechanism design.
Статья представлена к публикации членом редакционной коллегии В.Н. Бурковым
XI - международная конференция Системы проектирования, технологической подготовки производства и управления этапами жизненного цикла промышленного продукта (СДй/СДМ/РйМ-2011)
Уважаемые дамы и господа, приглашаем Вас принять участие в десятой международной конференции "Системы проектирования, технологической подготовки производства и управления этапами жизненного цикла промышленного продукта (САО/САМ/РОМ-2011)", которую планируется провести с 18 по 20 октября 2011 года в Москве, в Институте проблем управления им. В.А. Трапезникова РАН.
http://lab18.ipu.rssi.ru