УДК 519.83 + 519.86
МОДЕЛИРОВАНИЕ КОРРУПЦИИ О ТРЕХУРОВНЕВЫХ СИСТЕМАХ УПРАВЛЕНИЯ1
Г.А. Угольницкий, А.Б. Усов
Рассмотрены динамические модели коррупции в трехуровневых системах управления. Даны определения равновесий в динамических играх трех лиц с учетом требований устойчивого развития в условиях коррупции, предложены алгоритмы их построения. Исследованы модели экономической коррупции в системах контроля качества поверхностных вод, основанные на определенных информационных регламентах, приведены примеры численных расчетов.
Ключевые слова: коррупция, динамические игры, иерархическая система управления, принуждение, побуждение, условия устойчивого развития.
ВВЕДЕНИЕ
Пионерской работой по математическому моделированию коррупции считается статья С. Роз-Аккерман [1], представляющую собой адаптацию идей Г. Беккера относительно моделирования абстрактного рода преступлений и методики выбора соответствующих наказаний [2].
В дальнейшем коррупция как отдельная ветвь математического моделирования социально-экономических процессов изучалась по нескольким основным направлениям:
— математические модели, направленные на изучение коррупции как социальной практики внутри отдельной организации (внутренняя коррупция) и между организациями (внешняя коррупция);
— моделирование коррупции в общественно-политической жизни (в основном, коррупционных схем, присутствующих в избирательном процессе);
— исследование таких явлений, как множественность равновесных коррупционных состояний, цикличность возникновения и др.
Модели коррупции в иерархических системах описаны, например, в работах [3—8]. В России наиболее активно математическим моделированием коррупции занимаются А.А. Васин [10, 11], М.И. Левин [12], В.М. Полтерович [13]. Обзор моделей коррупции приведен в книгах [14—16].
1 Работа выполнена при финансовой поддержке РФФИ (проект № 12-01-00017) и Южного федерального университета.
В рамках авторского подхода управления устойчивым развитием построены и исследованы различные модели коррупции в иерархических системах и предложен ряд принципов ее моделирования [16—23], в том числе следующие.
• Базовой схемой моделирования служит иерархическая система «принципал — супервайзер — агент — объект» в различных модификациях и ее теоретико-игровое исследование, причем в динамических моделях состояние объекта описывается явно. Коррупции подвержен средний уровень управления (супервайзер), верхний уровень (принципал) считается некоррумпируемым и выполняет функции борьбы с коррупцией.
• Предполагаются известными определенные требования устойчивого развития управляемой системы (объекта). В динамических моделях они формулируются в терминах состояния объекта. Если требования устойчивого развития выполняются, то задача принципала считается решенной даже при наличии коррупции.
• Пары «принципал — супервайзер» и «супервайзер — агент» состоят в отношениях «ведущий — ведомый». Ведущий игрок (принципал или су-первайзер соответственно) для достижения своих целей использует методы принуждения (преимущественно административно-законодательные воздействия) и побуждения (преимущественно экономические воздействия); при математической формализации принуждение означает воздействие ведущего на множество допустимых стратегий ведомого (без обратной связи), а побуждение — на функцию выигрыша ведомого (с обратной связью).
• Различаются административная коррупция, при которой за взятку ослабляются административные требования, и экономическая коррупция, при которой взятка позволяет ослабить экономические требования верхнего уровня управления. При моделировании административная коррупция означает принуждение агента супервайзером с обратной связью по размеру взятки, а экономическая коррупция — побуждение агента супервайзером с дополнительной обратной связью по размеру взятки.
• Коррупция представляет собой угрозу устойчивому развитию объекта, поскольку взяточнику выгодно в обмен на взятку ослаблять требования устойчивого развития. С другой стороны, коррупция есть специфическая форма обратной связи в иерархических системах управления, в силу которой управляющие воздействия становятся функциями размера взятки.
При моделировании коррупции в динамических иерархических системах нами используются результаты, полученные А.Ф. Кононенко с соавторами [24—28].
1. МЕТОДЫ УПРАВЛЕНИЯ И ИНФОРМАЦИОННЫЕ РЕГЛАМЕНТЫ
Рассмотрим трехуровневую систему управления, включающую в себя субъекты управления верхнего (принципал), среднего (супервайзер) и нижнего (агент) уровней, а также управляемую динамическую систему (УДС) — см. рисунок. Для простоты ограничимся случаем одного субъекта на каждом из уровней (В, С и Н соответственно). Основная цель субъекта В состоит в выполнении требований устойчивого развития (УР), которые формализуются как принадлежность траектории УДС определенной области пространства состояний. Субъект В может иметь дополнительные собственные интересы. Субъект С следит за выполнением требований УР от имени субъекта В, но может пренебрегать ими в обмен на взятку от субъекта Н. На УДС воздействует только субъект Н, который преследует исключительно свои частные интересы, исходя из которых может предлагать взятку субъекту С. Каждый из субъектов В и С при воздействии на нижестоящего субъекта (С и Н соответственно) может применять методы принуждения (C — compulsion) или побуждения (I — impulsion). Подробное математическое описание этих методов как решений иерархической игры представлено в книге [17].
Таким образом, возникают четыре информационных регламента для иерархической игры трех лиц:
Трехуровневая система управления
— В и С используют принуждение (регламент CC);
— В использует принуждение, С — побуждение (регламент CI);
— В использует побуждение, С — принуждение (регламент IC);
— В и С используют побуждение (регламент II).
При этом имеет место административная
(управления принуждения субъекта С становятся функциями размера взятки) и экономическая (управления побуждения субъекта С становятся функциями размера взятки) коррупция. Конечно, возможны и другие схемы информационного взаимодействия.
Исходная теоретико-игровая модель имеет вид:
T
Jb(z( • )) = Je-atgB(z(t))dt ^ max; (1)
о
q(t) e Q; p(t) e P, (2)
T
Jc(z( • )) = Je-a'gc(z(t))dt ^ max; (3)
о
s(t) e S; r(t) e R; (4)
T
Jh(z( • )) = je~atgH(z(t))dt ^ max; (5)
u(t) e U; b(t) e B; (6)
x = f(u(t), x(t)), x(0) = x0; (7)
x(t) e X*; 11 0. (8)
о
Здесь г(0 = («(О, р(?), 5(?), г(?), и(?), Ь(?), х(?)); «(?) и р(?) — векторы управлений принуждения и побуждения для субъекта В; 5(?) и г (?) — векторы управлений принуждения и побуждения для субъекта С; и(?) — вектор управлений субъекта Н; Ь(?) — вектор управлений субъекта Н, трактуемых как взятки; векторы «, 5 и и имеют одинаковую размерность; /в и &в, ^с и £с, ^н и £н — интегральные и текущие функции выигрыша игроков В, С, Н соответственно; Т — период рассмотрения, который может быть как конечным, так и бесконечным (второй вариант более адекватен задаче управления УР); а — коэффициент дисконтирования; х(?) — вектор состояния УДС; соотношения (7) описывают динамику УДС при заданных начальных условиях и управлениях ведомого; условия (8) выражают требования УР применительно к УДС.
Предполагается, что О, Р, Б, Я, и и В — компактные подмножества соответствующих метрических пространств; функции /в, /С и /н непрерывны по своим аргументам, для функции f из соотношений (7) выполнены условия Каратеодори.
Математически задача управления УР в условиях коррупции представляет собой динамическую игру (1)—(7) с фазовыми ограничениями (8). Ее смысл — нахождение решения динамической игры (1)—(7), т. е. приемлемого компромисса между субъектами управления, удовлетворяющего требованиям (8) к состоянию УДС, в условиях, когда управления игрока С зависят от размера взятки, предлагаемой игроком Н. Будем далее в ряде случаев для простоты опускать зависимость от времени.
Пусть сначала оба субъекта В и С применяют принуждение. Управления побуждения не используются. Будем интерпретировать управление принуждения 5(?) игрока С как некоторую «квоту» и считать ее функцией размера взятки: 5 (?) = 5(Ь(?)), т. е. квота может быть увеличена в обмен на взятку (административная коррупция). В общем случае административная коррупция означает изменение управления принуждения за взятку в пользу агента. При этом принципал должен обеспечить выполнение требований УР (8) посредством принуждения супервайзера.
Информационный регламент в игре трех лиц типа СС («принуждение — принуждение») в условиях административной коррупции имеет следующий вид.
• Субъект верхнего уровня В (принципал) выбирает управление принуждения (постоянную
стратегию) « е О и сообщает ее субъекту С.
• Обозначим ¿Г = {5 = 5(«, Ь):О х В — Б}. С учетом
известного значения « е О субъект среднего
уровня С (супервайзер) выбирает и сообщает субъекту Н стратегию принуждения с обратной связью по размеру взятки (механизм административной коррупции) 5 = 5(«, Ь) из своего
множества оптимальных ответов ЯСС («, и, Ь) =
= Дг£шах /СС («, 5(«, Ь), и, Ь, х), где траектория х
5 е £
определяется стратегией и. Структура стратегии 5 = 5(«, Ь) обусловлена следующими соображениями. Параметрическая зависимость 5(«) определяется воздействием принципала на множество допустимых стратегий супервайзера при принуждении. Зависимость 5(Ь) — это дополнительная обратная связь по величине взятки, возникающая при наличии административной коррупции.
• Зная механизм 5 е Я^ («, и, Ь), субъект нижнего уровня (агент) выбирает свою стратегию (и, Ь) из множества оптимальных ответов
RHC (s) = Arg max^ /¿C (u(s(q, b)), b, x)),
(и, b) e U x B
где U = {u = u(s(q, b)): S ^ U}, траектория x порождается стратегией u = u(s(q, b)).
Гарантированный выигрыш принципала
CC
CC
Yb
= sup
inf
inf (n(q, s, u, b, x)),
q e Q s e RCC (q, и, b) (и, b) e R^C (s)
где п: О х Б х и х В х X — О х Б х и х В х X — проекция [24]. Равновесие «принуждения — принуждения» с учетом требований УР в условиях административной коррупции есть
(«*, 5*, и *, Ь*) е ВЯСС: /ВСС (п(«*, 5*, и *, Ь*, х)) =
СС
= Ув ,
ВЯСС = {(«, 5, ии, Ь) е О X Б х и х В : 5(«, Ь) е е ЯСС («, и, Ь), и(5(«, Ь)) е ЯНС (5)} (9)
при условии (8), траектория х* порождается управлением и *(5 *(« *, Ь*)).
Алгоритм построения равновесия (9) заключается в следующем.
1. Решается параметрическая задача оптимального управления субъектом Н (5)—(7): ее решением является пара (Ь*(?), и *(?) = и *(5(«(?), Ь*(?)))), при этом оператор и *(?) порождает для каждой тройки («(?), 5(?), Ь*(?)) единственную траекторию УДС х*(?).
2. Решается параметрическая задача оптимального управления субъекта С (3), (4) в силу соотношений (7) при Ь(?) = Ь*(?), и(?) = u*(?). Ее решением является оператор s *(?) = s Ь(?)).
3. Решается задача оптимального управления субъекта В (1), (2) в силу соотношений (7) с дополнительным условием (8) при s(t) = s Ь*(?)), и(?) = u Ь*(?))), Ь(?) = Ь*(?).
Если решение этой задачи q *(?) существует, то ситуация (q *, s *(q *, Ь*), u *(s *(q *, Ь*)), Ь*) есть равновесие «принуждения — принуждения» с учетом требований УР в условиях административной коррупции (9).
Пусть теперь оба субъекта В и С используют побуждение. Управления принуждения не применяются. Будем интерпретировать управление побуждения г(?) субъекта С как некий «налог» и считать его функцией размера взятки: г (?) = г(Ь(?)), т. е. налог может быть уменьшен в обмен на взятку (экономическая коррупция). Возможны и другие интерпретации экономической коррупции, например, г(?) есть некоторые ассигнования, которые могут быть увеличены за взятку, и т. п. Таким образом, общий смысл экономической коррупции — изменение стратегии побуждения за взятку в пользу агента. При этом принципал должен обеспечить выполнение требований УР посредством побуждения супервайзера.
Информационный регламент в игре трех лиц типа II («побуждение — побуждение») в условиях экономической коррупции имеет следующий вид.
• Субъект В выбирает стратегию побуждения с
обратной связью р е Р = {р :Я ^ Р} и сообщает ее субъекту С.
• Обозначим Я = {Г = г(р , и, Ь): РР х их В^ Я}.
С учетом известной стратегии р е Р субъект С выбирает и сообщает субъекту Н стратегию побуждения с дополнительной обратной связью по размеру взятки (механизм экономической коррупции) г = г(р , и, Ь) из своего
множества оптимальных ответов ЯС (Р , и, Ь) = II ~ -
= Ащшах /С (п(р , г, и, Ь, х)), где траектория х
г е к
порождается стратегией и.
Рассмотрим подробнее структуру стратегии
Г = г(р , и, Ь). Параметрическая зависимость г(р ) обусловлена тем, что в момент принятия решения
субъект С знает стратегию р субъекта В, воздействующую на функцию выигрыша субъекта С. Зависимость г(и) — это исходный механизм побуждения с обратной связью по действию агента и. За-
висимость r(b) — это дополнительная обратная связь по размеру взятки b, возникающая при наличии экономической коррупции.
• Зная механизм Г е R^ (p , u, b), субъект Н выбирает свою стратегию (U, b) из множества оптимальных ответов Rg (Г") = Arg max /g (u( Г),
(U, b)е Uх B
b, x), где U = {U = u(r(p , u, b)) : R ^ U}, траектория x порождается управлением u(r(p , u, b)). Гарантированный выигрыш принципала равен
ii ii ~ " " YB = sup inf inf ZB (n(p , r, u, b,
>p е P r е «, b) (u, b) е (r)
x)). Равновесие «побуждения — побуждения» с учетом требований УР в условиях экономической коррупции есть
(p*, r*, ", b*) е BR11 : J1 (n(p*, ", ", b*, x*)) =
ii
= Yb ,
BR11 = {(p , r, u, b) е P x R x U x B : r е
е Re1 (p, u, b), (u, b) е Rg (r)} (10) при условии (8), траектория x* порождается управлением u*(r*(p*, u*, b*)).
Алгоритм построения равновесия (10) опирается на предложенную в работе [24, с. 39] процедуру.
1. Обозначим для краткости y = (p , r, ii, b, x). Вычислим максимальный гарантированный выигрыш субъекта Н при использовании субъектами В и С стратегий наказания:
Lh = _ sup inf inf JH (n(y)).
(ii, b) e U x B p e p r e R
2. Определим множество dH = {(r, U, b) :
rII . ,~P ~ s , . rII ~P
/н (n(p , r, и, b, x)) i LH, где p — стратегия наказания субъекта С субъектом В, т. е. /<? (n(pP, r,
S II
U, b, x)) = min /C (n(y)).
p e P
3. Вычислим максимальный гарантированный выигрыш субъекта С при учете интересов субъекта Н и использовании субъектом В стратегии наказа-
Т II rII / / ~P S S ,
ния: LC = sup /C (n(p , r, и, b, x)).
(r, ü, b) e
4. Введем множество DC = {(p, r, ¿¿, b) :
jC (n(y)) l LC , /н (n(y)) l LH, Vi x(t) e X*} учета интересов субъектов С и Н при выполнении требований УР в условиях экономической коррупции.
5. Тогда гарантированный выигрыш субъекта В yb1 = sup /В1 (n(y)), откуда получаем равно-
(p, r, ü, b) e DC
весие (10). Конечно, реализация этого алгоритма
возможна при условиях DH ^ 0, DC ^ 0.
Наконец, рассмотрим информационный регламент типа CI, т. е. субъект В использует принуждение, а субъект С — побуждение. Таким образом, супервайзер реализует стратегию побуждения агента с дополнительной обратной связью по размеру взятки (экономическая коррупция), а принципал должен обеспечить выполнение требований УР посредством принуждения супервайзера.
• Субъект В выбирает управление (постоянную стратегию) q е Q и сообщает ее субъекту С.
• Субъект С выбирает и сообщает субъекту Н
стратегию r = r (q, u, b) из своего множества оп-CI
тимальных ответов RC (q, u, b) = Argmax /(n(q,
r e R
r, u, b, x)), где траектория x порождается стратегией u.
• Субъект Н выбирает свою стратегию (u, b) из множества оптимальных ответов RH (r) =
= Arg maxr /C (u( r), b, x).
(ü, b) e UX B
CI
Гарантированный выигрыш принципала yB =
= sup inf
q e Q
CI - -
inf /В (n(q, r, u, b, x)).
r e Rc(q, u, b) (ü, b) e Rjj1(r)
Равновесие «принуждения — побуждения» с учетом требований УР при экономической коррупции:
(«*, Г*, И*, Ь*) е ВЯС1 : /С1 (п(« *, Г*, И*, Ь*, х *)) =
С1
= Ув ,
ВЯС1 = {(«, Г, и, Ь) е О х Я X и X В : Г е
е ЯС1 («, и, Ь), (¿5, Ь) е ЯН1 (Г)} (11)
при условии (8), траектория х * порождается управлением и *(г *(« *, и *, Ь*)).
Алгоритм нахождения равновесия (11) заключается в следующем.
1. Вычислить максимальный гарантированный выигрыш субъекта Н при использовании
субъектами В и С стратегий наказания: хН =
= supr
s Я
(ü, b) e UX B
CI ~ ■
inf inf/H (n(q, r, u, b, x)).
q e Q
r e R
2. Найти множество D^1 = {(r, U, b) : /H (n(q,
- ^ CI
r, U, b, x)) l LH } для каждого q e Q.
3. Вычислить максимальный гарантированный
выигрыш субъекта С yj1 (q) = sup /<? (n(q, r,
~ = ci
(r, U, b) e
U, b, x)); обозначим через r*, (U*, b*) стратегии субъектов С и Н, реализующие (возможно, с s-точ-
ностью) величину yJI (q) для каждого q e Q.
4. Решить задачу оптимального управления с фазовыми ограничениями субъекта В (1), (2), (7), (8)
при r = r*, (U, b) = (U*, b*). Если ее решение q *
существует, то ситуация (q*, r* (q), U*(r(q, и, b), b*) есть равновесие «принуждения — побуждения» с учетом требований УР в условиях экономической коррупции (11).
Информационный регламент «побуждения — принуждения» рассматривается аналогично.
В качестве примера рассмотрим использование информационного регламента «побуждение — побуждение» (II) в условиях экономической коррупции в задаче контроля качества поверхностных вод.
2. МОДЕЛИ ЭКОНОМИЧЕСКОЙ КОРРУПЦИИ В СИСТЕМАХ КОНТРОЛЯ КАЧЕСТВА ПОВЕРХНОСТНЫХ ВОД
Рассмотрим трехуровневую систему контроля качества поверхностных вод, включающую в себя субъекты верхнего (федеральный центр, ФЦ), среднего (местные органы управления, ОУ), нижнего (промышленные предприятия, ПП) уровней и УДС [21]. Таким образом, (В, С, Н) = (ФЦ, ОУ, ПП). Будем считать, что на каждом уровне имеется единственный субъект.
Пусть на берегу реки (УДС) расположено ПП, сбрасывающее загрязняющие вещества (ЗВ) в реку вместе со сточными водами. Для простоты исследуем случай только одного вида ЗВ, например, азотосодержащих ЗВ. Предполагается, что взаимоотношения между элементами исследуемой динамической системы устроены следующим образом: ФЦ воздействует на ОУ, ОУ — на ПП, а ПП — только на УДС.
Промышленное предприятие стремится к максимизации получаемой в результате производства прибыли. В процессе производства в водоток (УДС) сбрасываются ЗВ. Органы управления определяют размер платы за сброс ПП загрязнений в водоток, который (размер) является функцией взятки, и стремятся к максимизации поступающих к ним от ПП средств. Федеральный центр должен поддерживать УДС в устойчивом состоянии. При по-
буждении ФЦ определяет, какая часть средств, полученных с ПП в виде платы за сброс загрязнений в водоток, остается у ОУ; при принуждении — минимально допустимую степень очистки сточных вод на ПП (если ОУ применяет принуждение по отношению к ПП) или минимально допустимый размер платы за сброс ЗВ (если ОУ применяет побуждение по отношению к ПП).
Орган управления преследует только собственные интересы и может быть заинтересован в получении взяток от ПП. За взятки ОУ занижает размер платы за сброс загрязнений в водоток. Чиновники ОУ взятки рассматривают как один из факторов (наряду с доходами от платы за загрязнение) в общем балансе их интересов. Фактически ОУ, вопреки декларируемым целям защиты государственных интересов, часто выступает как коммерческая структура. Поскольку благополучие ОУ зависит только от ФЦ, но не от качества жизни в регионе, то стандарты качества речных и сточных вод могут нарушаться в силу экономической коррупции. Федеральный центр должен создать условия, при которых поддержание системы в устойчивом состоянии даже в условиях коррупции будет экономически выгодно для ОУ. Добиться этого ФЦ может неединственным образом, поэтому, кроме того, он стремится к оптимизации индивидуального функционала. Если на конечном интервале времени дисконтирование не учитывается, то целевой функционал ФЦ
/в(Р('), «!(•), «2(-), Г(•), и(-), *(•)) =
Слагаемое CB(a(t)) в выражении (12) отражает затраты ФЦ на очистку речной воды; a(t)(1 — — p(t)r (b(t)) — поступления средств от ПП в виде платы за сброс ЗВ в речную систему. Максимум функционала (12) ищется по p(t) при побуждении и по qx(t) или q2(t) — при принуждении. Таким образом, в целевом функционале (12) учтены затраты на централизованную очистку речной воды и поступления от ПП в виде платы за сброс загрязнений.
Орган управления стремится к максимизации средств, поступающих к нему от ПП в виде взяток и платы за сброс загрязнений с учетом взяток, за вычетом расходов на очистку речной воды. Целевой функционал ОУ
т
/c(p(-), r(•), s(-), u(-), b(-)) = J{- Cc(a(t)) +
0
+ a(t)r (b(t))p(t) + b(t)a(t)}dt ^ max. (13)
Здесь CC(a(t)) — функция затрат ОУ на улучшение качества речной воды; ОУ управляет размером платы за сброс загрязнений в водоток r(b(t)) при побуждении и минимально допустимой степенью очистки сточных вод на ПП s(b(t)) — при принуждении. Слагаемое CC(a(i)) отражает затраты ОУ на очистку речной воды; a(t)p(t)r (b(t)) — поступления средств от ПП за сброс загрязнений в водоток; a(t)b(t) — размер взятки за сброс в водоток загрязняющих веществ в количестве a(t).
Цель ПП — максимизация своей прибыли в условиях коррупции, т. е.
J{-CB(a(t)) + (1 -p(t))r(b(t))a(t)}dt ^ max, (12) /H(r(.), и(-), b(-)) = J{zR(0(t)) - CH(u(t))W(t)
где ? — временная координата; и(?) — доля загрязняющих веществ, удаляемых на ПП в процессе очистки сточных вод; Ж(?) (а(?) = Ж(?)(1 — и(?))) — количество ЗВ, сбрасываемых в реку предприятием до (после) очистки сточной воды в момент времени ?; Св(а(?)) — функция затрат центра на улучшение качества речной воды, зависящая от общего количества сброшенных в реку ЗВ (а(?)); Т — момент времени, до которого ведется рассмотрение; г (Ь(?)) — функция платы за единицу сброшенных ЗВ, в условиях коррупции зависящая от размера взятки Ь(?); р(?) — доля поступающих от ПП средств, которая остается в распоряжении ОУ; «Д?) и «2(?) — управление ФЦ при принуждении, когда ОУ, в свою очередь, применяет принуждение и побуждение соответственно.
r(b(t))a(t) - b(t)a(t)}dt ^ max.
(14)
Здесь CH(u(t)) — функции затрат ПП на очистку единицы сбрасываемых ЗВ; 0(t) — производственные фонды; R(0(t)) — производственная функция ПП; z = const — цена единицы продукции. Максимум функционала (14) ищется по функциям u(t) и b(t).
Слагаемое zR^(t)) выражает доход ПП от реализации R(0(t)) единиц произведенной на предприятиях продукции, a(t)r (b(t)) — плату за сброс ЗВ в водоток; CH(u(t)) W(t) — затраты ПП на очистку сточной воды; a(t)b(t) — размер взятки за сброс в водоток загрязняющих веществ в количестве
= D u( t) . 1 - u (t) ' D = const.
a(t). Далее рассмотрим случай CH(u(t)) = D-
0
Оптимизационные задачи (12) — (14) решаются при ограничениях на управления
— фц У1 т р(?) т у2; о т т 1 - в;
0 т q2(t) т гтах; V? : ? е [0, Т]; (15)
— ОУ т s(í) т 1 - в; «2(?> т г(Ь(?)) т Гтах;
V? : ? е [0, Т]; (16)
— ПП £(?) т и(?) т 1 - в; о т Ь(?) т Ьтах;
V? : ? е [0, Т]. (17)
Здесь значение величины в определяется технологическими возможностями ПП по очистке сточных вод; Ьтах — максимально возможная взятка, приходящаяся на единицу сброшенных ЗВ; гтах — максимально допустимый размер платы за сброс ЗВ без коррупции; у1 и у2 — минимально допустимые доли средств, поступающих от ПП к ФЦ и
Оу; значения rmax, bmax, П и ^2 зЭДанЫ.
Динамика изменения производственных фондов ПП описывается обыкновенным дифференциальным уравнением
¿Ф
Л
= —кФ + Y, Ф(0) = Ф0,
(18)
где к = const — коэффициент амортизации производственных фондов; Y — инвестиции в производство, которые будем считать постоянной величиной; величина Ф0 = const задана.
Пусть общее количество сбрасываемых ЗВ (до очистки) зависит от количества произведенной на ПП продукции линейно и производственные функции имеют вид
W(t) = pR^), R^) = ХФ°'5(0, X, в = const.
(19)
В качестве характеристики речной воды возьмем концентрацию ЗВ х(?), изменение которой со временем описывается обыкновенным дифференциальным уравнением
^ = Дх(?), и(?), ?), х(0) = х0, (20)
где Дх(?), и(?), ?) — некоторая заданная функция.
Известны предельно допустимые концентрации ЗВ в водотоке х
0 m x(t) m xmax, Vt : t е [0, T], и ограничения на качество сточной воды
(21)
W( t) [ 1 - u ( t) ]
Q°( t)
m Q,
max
Vt : t е [0, T], (22)
где Q (t) — расход воды на ПП в момент времени t,
Рассмотрим вначале информационный регламент II. Будем считать, что qx(t) = q2(t) = s(t) = 0, управлениями служат функции p(t), r(t), u(t), t) и b(t). Введем обозначения для проекций п( r) = = r (p(r), u, b); n(u) = u(r (p(r), u, b). Будем считать, что e r m D m r .
max max
Решение задачи (12)—(22) строится в соответствии с описанным в § 1 алгоритмом в случае информационного регламента II в условиях экономической коррупции, а именно:
1) вычисляется величина LH = T(D — 2 JDrmax) s
T T
s J W(t)dt + JгВ(Ф)Л; стратегии наказания имеют
00
вид / = p (rmax) = 0; ?P = r" (p (rmax), u>, b>) = rmax;
u > = 1 — ^D/rmax, ь >=0,
2) определяется множество dH = j (r, u, b) :
-J W(t) J D п ( u) + (1 - n( u )(n(") + b (t)))|dt m T x
0 L 1 - n(u) J
T
s (D — 2л/гт~ ) J W(t)dtJ;
il J
0
3) вычисляется величина
T
l£ = sup г {—CC(W(t)(1 — n( u)) +
(r, u, b) е DH °
+ (1 — n( u ))W(t)b(t))}dt;
4) вводится множество
T
DC = {(p , r, u, b) : J{—Cc((1 — n(u ))W(t)) +
0
ii
+ (1 — n( u ))W(t)(n( r )p(r(t)) + b(t))}dt l LC
TJ
— J W(t) Jd—"<-"1-
° L 1 - n( u)
+ (1 - n( u )(n( r) + b (t )))dt
m
m
t(d—2,ydmax) j w(t)dt,
значения xmax и Qmax заданы.
V? : 0 < х(?) < Хтах, ^(?)[1 - и(?)]/Оо(?) т 5) определяется величина т
у£ = __ 8ИР {-СВ(Ж(?)(1-п(и)) +
(р, г, и, Ь) е ДС о
+ (1 - р(г(?))) Ж(?)л(г )(1 - п(и ))}А и находится равновесие «побуждения — побуждения».
0
Приведем примеры нахождения равновесий. Во всех примерах равновесие «побуждения — побуждения» находится численно методом прямого упорядоченного перебора с учетом гипотезы постоянства управлений на некоторых временных интервалах [19, 20]. Именно, считается, что субъекты меняют свои управления п раз в известные моменты времени, т. е.
m(t) =
если 0 < t < tj, m2, если t1 < t < t2,
mN, если tn _, < t < T,
n -1 ■
где m. = const; t. = /At; At = T/n; m(t) — управление одного из субъектов управления (одна из функций p(t), r(t), u(t) и b(t)).
Пример 1. Пусть Дх(0, u(t), t) = -шх + C W(t)(1 - w(t)); CB(a(t)) = C2a(t); CC(a(t)) = C3a(t); Cp C2, C3 = const;
C2 = 20 у. е.; C3 = 30 у. е.; Cj = 0,015 (л • сут-1); n = 3; ш = 0,002 сут-1; z = 25 сут-1; = 200 у. е.; bmax = 70 у. е.; T = 540 сут; = 10 мг/л; Qma = 100; Ф0 = 1016 у. е.; D =18; x0 = 6 мг/л; х = 2; yj = 0,3; у2 = 0,8; s = 0,1; Y = 0 у. е.; р = 0,3 мг/(сут у. е.); Q0(t) = 0,6 W(/)/Qm„; к = 0,001 сут-1 (у. е. — условная единица). Получим, что коррупция в системе есть и L^ = -132 507 у. е.; L^ =
= 285 317 у. е.; у£ = 105 764 у. е.; /? = 285 882 у. е.;
/Н = -132 483 у. е., где , /Н — прибыль ОУ и ПП соответственно в равновесии «побуждения — побуждения».
Пример 2. В случае входных данных примера 1 и уменьшения затрат на очистку сточных вод на ПП (D = 1) коррупция в системе также присутствует, прибыль ПП растет, остальных субъектов уменьшается, так как на ПП выгодна высокая степень очистки сточных вод:
l|| = 397 870 у. е.; l£ = 93 911 у. е.; у" = 2166 у. е.;
/" = 94 262 у. е.; /£ = 398 121 у. е.
Пример 3. В случае входных данных примера 1 и увеличения расходов на очистку речной воды со стороны ОУ (С3 = 200 у. е.) ОУ терпит убытки, коррупция в системе есть: L^ = -132 507 у. е.; L^ = -269 677 у. е.; у£ = 175 732 у. е.; /<? = -269 156 у. е.; = -132 452 у. е.
Пример 4. Равновесие II с учетом условий УР системы существует не всегда. Например, его не существует в случае входных данных примера 1 и роста на ПП затрат на очистку сточных вод (D = 100), увеличения максимально возможной величины удельной взятки (b = 500 у. е.), уменьшения максимально допустимой
платы за сброс ЗВ (гтах = 10 у. е.) или ухудшения экологического состояния системы (х0 = 9 мг/л).
Пример 5. В случае входных данных примера 1 и уменьшения максимально возможной удельной взятки (Ьтах = 10 у. е.) коррупция в системе отсутствует, прибыль ФЦ и ПП растет, ОУ — падает: ¿Н = —132 507 у. е.; 41 = -477 12 у. е.; у" = 301 948 у. е.; /С = 68 267 у. е.; /н = -111 052 у. е. ♦
Рассмотрим информационный регламент СС. Считаем, что «2(?) = 0, а функции р(?) и г(?) заданы и не меняются, управлениями служат функции «Д?), я(?), и(?) и Ь(?). Пусть V?: ? е [0, Т] ^ О1 е2г(?).
Решение задачи (12)—(22) опять строится в соответствии с описанным в § 1 алгоритмом в случае информационного регламента СС, а именно:
1) если 1 - ^Б/г(?) + Ьтах < *(?) < 1 - е, то Ь*(?) = 0; и*(?) = *(?);
если 1 - л/Б/гС?) < *(?) < 1 - ^О/г(?) + Ьтах , то
Ь*(?) = Ьтах; и*(?) = 1 - л/О/г(?) + Ьтах ) или (Ь*(?) = 0; и*(?) = я(?)) в зависимости от входных данных модели;
если *(?) < 1 - УОМО, то (Ь*(?) = Ьтах; и*(?) = 1 - л/О/г(?) + Ьтах) или (Ь*(?) = 0; и*(?) =
= 1 - л/ОМО).
2) решается параметрическая задача максимизации функционала (13), (16) с учетом уравнения (18) и функцией (19) при Ь(?) = Ь*(?), и(?) = и*(?); ее решением является оператор /(?) = /(«Д?), Ь(?));
3) решается задача оптимального управления субъекта В (12), (15), (18)—(22) при я(?) = /(«Д?), Ь*(?)); и(?) = и*(5*(«1(1), Ь*(?))), Ь(?) = Ь*(?). Находится равновесие «принуждения — принуждения».
Равновесие ищется численно методом прямого упорядоченного перебора с учетом гипотезы постоянства управлений на некоторых временных интервалах [19, 20] в случае р(?) = 0,4; г (?) = гтах/2. Заметим, что результаты существенно зависят от заданных функций р(?) и г (?).
Пример 6. В случае входных данных примера 1 доходы ФЦ и ПП выросли по сравнению с примером 1, ОУ —
упали и /д0 = 142 658 у. е.; /°С = 35 664 у. е.; /°С =
= 109 371 у. е., где /£С , /£С и /¿С — прибыль ФЦ, ОУ
и ПП соответственно в равновесии «принуждения — принуждения».
Пример 7. В случае входных данных примера 2 доходы ФЦ и ПП опять выросли по сравнению с примером 2,
ОУ — упали, и /^ = 28 531 у. е.; /^С = 7132 у. е.;
/£С = 4 588 851 у. е.
Пример 8. В случае входных данных примера 3 доходы ФЦ и ПП упали по сравнению с примером 3, ОУ —
выросли, /дС = 28 531 у. е.; = —114 127 у. е.; /¿С = = -632 454 у. е.
Пример 9. В случае входных данных примера 4 равновесие СС с учетом условий УР системы существует во всех указанных случаях (при Б = 100, Ьтах = 500 у. е., х0 = 9 мг/л). Путем принуждения удается добиться выполнения условий УР. ♦
В случае информационного регламента С1 будем считать, что = 0; = 0, а функция р(?) задана, управлениями служат функции #2(0, г (0, и(?), Ь(?). Введем обозначения для проекций
я; ~
п( г) = г(4, и, Ь); п( и) = и(4, и, Ь)).
Решение задачи (12)—(22) строится в соответствии с описанным в § 1 алгоритмом в случае информационного регламента С1 в условиях экономической коррупции, а именно:
т
1) вычисляется величина ХН = — ^^ | W(í)dí —
о
тт - в |г($Щ()(И + |гЯ(Ф)^; 4р =1 - е; Гр =
оо = Г (, ир, Ьр) = гтах; ир = 1 - в; Ьр = 0;
2) определяется множество
ПС1 и» 8 ,ч
Бн = {(Г, и, Ь) :
- | W(í)|Б п ( и ^ + (1 - п(и)(п(г) + Ь(0))| Л т о ^ 1 - п( и) ^
тт т к-^ | + в |г(?)Щ()(И;
в
о
о
3) вычисляется величина
т
уС1 (42) = с1 | {-^(^0(1-п( и)) +
(Г, и, Ь)Е % о
+ р (^(?)л( Г )(1 - п( и ))№
г г *
обозначим через Г * и (и*, Ь ) стратегии субъектов С и Н, реализующие величину у!? (42);
4) решается задача оптимального управления с фазовыми ограничениями субъекта В (12), (15),
(18)—(22) при Г = Г *, (и, Ь) = (и*, Ь ) и находится равновесие «принуждения — побуждения» с уче-
том требований УР в условиях экономической коррупции.
Равновесие С1, как и в рассмотренных ранее случаях, ищется численно и существенно зависит от выбранной функции р(?). Далее считается, что р(0 - 0,4.
Пример 10. В случае входных данных примеров 1, 4 и 5 равновесия «принуждения — побуждения» с учетом условий УР системы не существует. Для ОУ и ПП выгодно нарушать условия УР, а у ФЦ недостаточно рычагов воздействия на них.
Пример 11. В случае входных данных примера 2 доходы ОУ и ПП выросли по сравнению с примером 2, ФЦ —
упали, коррупция в системе есть, и = 387 556 у. е.;
/С = 62 665 у. е.; ¿С1 = 42 002 у. е.; /С = 389 882 у. е.,
где /В"1, /С"1 и /С — прибыль ФЦ, ОУ и ПП соответственно в равновесии «принуждения — побуждения».
Пример 12. В случае входных данных примера 3 доходы ПП упали по сравнению с примером 3, ФЦ и ОУ —
выросли, коррупция в системе есть, = -703 783 у. е.;
С1
в = 136 309 у. е.; /<? = -68 154 у. е.; /^ =
ГС1
/
= -636 750 у. е. ♦
Таким образом, как в случае информационного регламента II, так и регламента С1 равновесие с учетом условий УР системы строится не всегда, т. е. ФЦ не удается обеспечить выполнение условий УР из-за коррупции. В случае регламента СС равновесие существует для более широкого класса входных функций. Прибыль различных субъектов управления в равновесии системы существенно зависит от принятого информационного регламента.
ЗАКЛЮЧЕНИЕ
В настоящей работе даны определения и проведено исследование равновесий «принуждения и побуждения» с учетом требований устойчивого развития в условиях коррупции в трехуровневых системах управления. Методы принуждения и побуждения при иерархическом управлении [17] формализуются как информационные расширения игры двух лиц, в основном соответствующие регламентам Г^ и Г2^ описанным в книгах [24, 25]. Требования устойчивого развития учитываются дополнительно как фазовые ограничения в дифференциальной игре. Административная и экономическая коррупция трактуются как обратная связь управлений принуждения и побуждения по размеру взятки [18—23].
В играх трех лиц в аспекте методов управления возможны четыре варианта информационных регламентов: оба субъекта применяют один и тот же метод (принуждение или побуждение) либо они
применяют различные методы, при этом во всех случаях управления игрока среднего уровня дополняются административной или экономической коррупцией. Равновесие «принуждения — принуждения» с учетом требований устойчивого развития в условиях административной коррупции строится путем решения последовательности связанных параметрических задач оптимального управления с соответствующими фазовыми ограничениями. Для нахождения равновесия «побуждения — побуждения» с учетом требований устойчивого развития в условиях экономической коррупции использована предложенная в работе [24] процедура, основанная на построении взаимосвязанных, выгодных для игроков, программ. Равновесия «принуждения — побуждения» и «побуждения — принуждения» с учетом требований устойчивого развития в условиях коррупции ищутся с помощью комбинации этих подходов.
В качестве иллюстрации представлено применение указанных методов к задачам контроля качества поверхностных вод. Показано, что для рассмотренных примеров в случае регламента «принуждения — принуждения» принципалу всегда удается обеспечить выполнение требований устойчивого развития даже при коррупции, а для других регламентов — только при определенных значениях модельных параметров. Таким образом, в рамках примеров административно-законодательные методы в борьбе с коррупцией более эффективны, чем экономические.
ЛИТЕРАТУРА
1. Rose-Ackerman S. The Economics of Corruption // Journal of Political Economy. - 1975. - N 4. - Р. 187-203.
2. Becker G. Crime and Punishment: An Economic Approach // Journal of Political Economy. - 1968. - N 76. - P. 169-218.
3. Bac M. Corruption and supervision costs in hierarchies // Journal of Comparative Economics. - 1996. - N 2. - P. 99-118.
4. Bag P.K. Controlling corruption in hierarchies // J. Comparative Economics. - 1997. - Vol. 25, N 3. - P. 322-344.
5. Mookherjee D., Png I.P. Corruptible Law Enforcers; How Should They Be Compensated // Economic Journal. - 1995. -N 105. - Р. 112-121.
6. Hindriks J., Keen M., Muthoo A. Corruption, Extortion and Evasion // J. Public Economics. 1999. - Vol. 74, N 3. -P. 395-430.
7. Mishra A. Hierarchies, incentives and collusion in a model of enforcement // J. Economic Behavior and Organization. — 2002. - Vol. 47. - P. 165-178.
8. Lambert-Mogiliansky A., Majumdar M., Radner R. Petty corruption: A game - theoretical approach // Journal of Economic Theory. - 2008. - Vol. 4. - P. 273-297.
9. Drugov M. Information and delay in an agency model // The Rand J. Economics. - 2010. - Vol. 41. - P. 598-615.
10. Васин А.А., Картунова П.А., Уразов А.С. Модели организации государственных инспекций и борьбы с коррупцией //
Математическое моделирование. — 2010. — Т. 22, № 4. — С. 67—89.
11. Васин A.A., Николаев П.В., Уразов А.С. Механизмы подавления коррупции // Журнал новой экономической ассоциации. — 2011. — № 10. — С. 10—30.
12. Левин М.И., Цирик М.Л. Коррупция как объект математического моделирования // Экономика и математические методы. — 1998. — Т. 34, № 3. — C. 40—62.
13. Полтерович В.М. Факторы коррупции // Экономика и математические методы. — 1998. — Т. 34, № 3. — С. 30—39.
14. Выборнов Р.А. Модели и методы управления организационными системами с коррупционным поведением участников. — М.: ИПУ РАН, 2006.
15. Левин М.И., Левина Е.А., Покатович Е.В. Лекции по экономике коррупции. — М.: Изд. дом ВШЭ, 2011.
16. Угольницкий Г., Денин К. Математические модели коррупции. Теория и приложения. — LAP Lambert Academic Publishing, 2011. — 152 с.
17. Угольницкий Г.А. Иерархическое управление устойчивым развитием. — М.: Физматлит, 2010. — 336 с.
18. Денин К.И., Угольницкий Г.А. Теоретико-игровая модель коррупции в системах иерархического управления // Известия РАН. Теория и системы управления. — 2010. — № 1. — С. 192—198.
19. Угольницкий Г.А., Усов А.Б. Управление устойчивым развитием иерархических систем в условиях коррупции // Проблемы управления. — 2010. — № 6. — С. 19—26.
20. Угольницкий Г.А., Усов А.Б. Устойчивое развитие систем управления с учетом коррупции // Математическая теория игр и ее приложения. — 2010. — Т. 2, вып. 4. — С. 106—119.
21. Угольницкий Г.А., Усов А.Б. Статические модели коррупции в системах контроля качества водных ресурсов // Проблемы управления. — 2012. — № 4. — С. 38—44.
22. Антоненко А.В., Угольницкий Г.А., Усов А.Б. Статические модели борьбы с коррупцией в иерархических системах управления // Известия РАН. Теория и системы управления. — 2013. — № 4. — С. 165—176.
23. Угольницкий Г.А., Усов А.Б. Динамические иерархические игры двух лиц в программных стратегиях и их приложения // Математическая теория игр и ее приложения. — 2013. — Т. 5, вып. 2. — С. 82—104.
24. Горелик В.А., Кононенко А.Ф. Теоретико-игровые модели принятия решений в эколого-экономических системах. — М.: Радио и связь, 1982. — 144 с.
25. Горелик В.А., Горелов М.А., Кононенко А.Ф. Анализ конфликтных ситуаций в системах управления. — М.: Радио и связь, 1991.
26. Горелов М.А., Кононенко А.Ф. Динамические модели конфликтов. Язык моделирования // Автоматика и телемеханика. В печати.
27. Горелов М.А., Кононенко А.Ф. Динамические модели конфликтов. Равновесия // Там же. В печати.
28. Горелов М.А., Кононенко А.Ф. Динамические модели конфликтов. Иерархические игры // Там же. В печати.
Статья представлена к публикации членом редколлегии
В.Н. Бурковым.
Угольницкий Геннадий Анатольевич — д-р физ.-мат. наук,
зав. кафедрой, S (863) 297-51-14, Н [email protected],
Усов Анатолий Борисович — д-р физ.-мат. наук, профессор,
Южный федеральный университет, г. Ростов-на-Дону.