Борьба с оппортунистическим поведением субъектов в системах контроля качества речных вод
М.С. Кравцов, А.Б. Усов Южный федеральный университет, Ростов-на-Дону
Аннотация: В статье рассматривается задача борьбы с оппортунистическим поведением супервайзера и агентов в системе контроля качества речных вод. Строится двухуровневая иерархическая модель, включающая супервайзера (ведущий) и агентов (ведомые). Каждый из субъектов стремится к максимизации своей целевой функции. В модели неявно присутствует принципал, борющийся с оппортунистическим поведением супервайзера и агентов. В качестве метода управления используется метод побуждения. Исследуется поведение системы в случае информационных регламентов игры Штакельберга. Указан алгоритм нахождения равновесия Штакельберга. Продемонстрированы результаты имитации модели при различных начальных условиях. Дан анализ полученных результатов.
Ключевые слова: равновесие Штакельберга, двухуровневая система, побуждение, имитация, оппортунистическое поведение, качество речной воды, иерархия.
Введение
В настоящее время развитие промышленности приводит к появлению и углублению разного рода экологических проблем. Промышленные предприятия сбрасывают отходы своих производств в атмосферу и водоток. В результате они обязаны контролировать свой уровень выброса загрязняющих веществ. При превышении концентраций загрязняющих веществ в речной системе предприятия выплачивают компенсацию, которая пойдет на рекреационные мероприятия. Часть предприятий передают вышестоящему органу (Центру, супервайзеру) неверные данные об объемах выбросов загрязняющих веществ. Учитывая это, центр за определенную плату может снизить плату за сброс загрязнений в водоток или предоставить предприятию возможность скорректировать передаваемые данные об объеме сброса загрязнений. Такая деятельность со стороны Центра нежелательна, поэтому сам Центр может подвергнуться санкциям при обнаружении вышестоящими органами нарушений в своей деятельности. Каждый из участников таких отношений стремится извлечь для себя максимальную
выгоду. Моделируемая задача тесно связана с задачами из теории игр, методами оптимизации, а также представляет собой интерес в плане понимания экономических отношений в природоохранной деятельности [14].
Постановка задачи
Рассматривается задача контроля за сбросом загрязняющих веществ (ЗВ) в реку. Имеется Центр (Супервайзер) и Предприятие (Агент), сбрасывающее загрязнения в водоток. Супервайзер влияет на Агента путем выбора размера платы за сброс ЗВ. Супервайзер также позволяет Агенту скрыть некоторый объем выбросов ЗВ за определенную плату. Агент определяет количество сбрасываемых ЗВ, выбирая степень очистки сточных вод и размер расходов, которые он готов понести за предоставление неверных данных о выбросах ЗВ. В задаче неявно присутствует принципал, осуществляющий контроль за Супервайзером. Принципал наказывает Супервайзера, если тот разрешает Агенту предоставлять недостоверные данные [5-7]. В модели явно задана вероятность, с которой принципал может раскрыть подобные нарушение и наказать Супервайзера. Последнее отражено в целевой функции Супервайзера.
Таким образом, имеется двухуровневая иерархически организованная система управления, в которой Супервайзер играет роль Ведущего, а Агент -Ведомого. Супервайзер первым делает ход, назначает размеры платы за выброс декларируемого количества ЗВ и за единицу скрытых от принципала ЗВ. Получив эти данные, Агент выбирает свою стратегию, устанавливая степень очистки выбросов и объем скрытых выбросов ЗВ, за который он заплатит определенную сумму. Оба игрока стремятся максимизировать свою прибыль. Целевые функции игроков возьмем в виде:
y = wi(1 - а)(1 - p)V(5) - Re с(B) + w2(1 - p)X - (1)
(Bs (w 2 (1 - p )) + w 2 (1 - p )X )F (B - B1) max
s, X
y2 = Z - wCl (p)- w1 (1 - p)v(s)- w2 (1 - p)x ^ max (2)
p, w 2
Ограничения на управления имеют вид:
0 < w2 < (3)
0 < p < 1 - s (4)
V(S)t 5,0 < S < 5max (5)
0 < X (6)
0 < a < 1 Здесь:
• У! - целевая функция Супервайзера;
• У2 - целевая функция Агента;
• V (s) - функция платы за единицу сброшенных загрязнений;
• s - управление Супервайзера. Ограничение (5), (6) указывает на то, что Супервайзер не может бесконечно повышать тарифную ставку;
• Z - фиксированный доход Агента, который он получает в результате своей производственной деятельности. В данной задаче взят за константу;
• Cl (p) - затраты Агента на очистку единицы выбросов;
• p - степень очистки выбросов, управляющий параметр Агента. Условия (3), (4) показывают, что не существует технологий, позволяющих производить полную очистку выбросов;
• w = wj + w2 - объем выбросов Агента, где w1 - декларируемый объем, который Агент сообщает Принципалу, w2 - недекларируемый объем;
• Re с( B) - затраты Супервайзера на рекреационные мероприятия;
• B - концентрация ЗВ в реке;
• Г(В - В1) - вероятностная функция обнаружения нарушений со стороны Супервайзера в зависимости от отклонения концентрации ЗВ В от предельно допустимого уровня концентрации ЗВ В1;
• X - вознаграждение Супервайзера со стороны агента за единицу недекларируемого объема сброшенных ЗВ. Сверху ограничений на эту величину нет, чтобы Супервайзер имел возможность установить достаточно высокое вознаграждение, тем самым не позволяя Агенту скрывать от принципала выброс ЗВ;
• Bs(w2 (1 - р)) - штраф при обнаружении нарушений со стороны Супервайзера за единицу недекларируемого объема сброшенных ЗВ;
• Параметр а указывает на то, что Супервайзер получает только часть от суммы штрафов, остальная часть поступает в распоряжение принципала.
Плотность вероятности для функции Г (В - В1) можно задать в следующем виде:
|0, Ь < - В
I (Ь) =
2
еЬ, - В2 < Ь < В3 0, В3 < Ь
где Ь = В - В1 - отклонение концентрации ЗВ от предельно допустимого уровня ЗВ в реке, - В2 - нижняя граница отклонения концентрации ЗВ, до достижения уровня которой Принципал не фиксирует нарушений со стороны Супервайзера, В3 - верхняя граница отклонения концентрации ЗВ, при достижении которой Принципал точно находит факт нарушений и штрафует Супервайзера.
Тогда функция распределения г (Ь) примет следующий вид: |0, Ь < - В.
Г (Ь) =
'2
еЬ - е В2
В < Ь < В,
В3 - В2 ' 2 — 3
е 3 - е 2
1, В3 < Ь
Рассмотрим целевую функцию Агента (2). Пусть
С1 (р) = ; б =сопб1;; V(5) = 52; Яе с (в) = в. 1 - Р
Функция штрафов за нарушения со стороны Супервайзера имеет вид: Bs(w2 (1 - р)) = (1 - р), где у - некоторая константа. Зафиксируем X и 5 и найдем частные производные.
wD
дУ 2 =. др (1 - р)
2 ( - W2 ) - рУО-W2 (1 - р)Х
дУ 2 д w,
= (1 - рXV(5)- X)
(7)
(8)
В (8), исходя из условия (4), первый множитель неотрицателен, второй зависит от управлений Супервайзера. Так как (8) не зависит от аргумента w2, то сначала решается это уравнение, а затем находится (7): го, V (о) < Х
^, V(5) > X
W2 = V
(9)
о,
р = V -
^ - w2 ^(о) + w2X < wD
wD
wD
(w - w2 ^ (о) + w2 X'
wD < (w - w2 )V(о) + w2 X < 2
£
(10)
1 -£,
wD
< (w - w2 )V(5) + w2 X
Решения (9), (10) есть функции с двумя аргументами - 5 и X. Подставив их в (1) найдем оптимальное управление Супервайзера. В итоге получаем решение задачи (1)-(6), которое является равновесием Штакельберга [8,9].
Аналитическое решение задачи Супервайзера затруднено из-за вида функции (10). Поэтому при помощи комбинации аналитических и дискретных методов задача (1)-(6) была решена при помощи программы, написанной на языке С++ [10]. Некоторые результаты расчетов приведены в
2
£
Таблице №1. В расчетах X ограничим сверху таким образом, чтобы выполнялось условие X > V(я), взяв Xтзх = V(^тзх)+1. Расчеты проведены в случае 2 = 10000;^ = 0.25; ^ = 10°; ™ = 5'Жт = 3; Xmax = 10001
Таблица №1
Результаты счета при различных входных параметрах
У В а Б р X я У1 У 2
100 10 0.4 200 3 0.75 9900.9 100 10414.8 -5425.7
100 10 0 200 0 0.75 10001 100 12490 -5500
100 10 0.4 800 3 0.7125 9800.9 100 11892.3 -14116
10э 10 0.4 800 0 0.7125 9900.9 99 8443.3 -14002
100 2 0.4 1600 3 0.5925 9800.9 99 16722 -21601
Таким образом, изменение различных параметров влияет на оптимальные стратегии обоих игроков. Изменение параметра а влияет на управления Супервайзера. При достаточно малых а (большая часть штрафов остается у Супервайзера) Супервайзеру становится невыгодно прибегать к нарушениям и уступкам Агенту. Параметр Б при изменении в большую сторону вынуждает Агента снижать степень очистки и увеличивать размер платы за сброс загрязнений. Параметры у и В влияют на оптимальные стратегии Супервайзера.
Заключение
Предлагаемая модель представляет собой дуополию Штакельберга. Нахождение равновесия сводится сначала к нахождению реакции Агента на выбранные управления Супервайзера, затем к нахождению оптимальной для самого Супервайзера оптимальной стратегии. Ввиду сложности аналитического решения, предлагается решить задачу путем имитационного моделирования.
В дальнейшем планируется рассмотреть динамические модели при наличии возможности коррупционного поведения субъектов.
Работа выполнена при финансовой поддержке Российского фонда фундаментальных исследований, проект № 18-01-00053.
Литература
1. Курбатов В.И., Угольницкий Г.А. Математические методы социальных технологий. М.: Вузовская книга, 1998. 256 с.
2. Горелик В.А., Кононенко А.Ф. Теоретико-игровые модели принятия решений в эколого-экономических системах. М.: Радио и связь, 1982. 144 с.
3. Горстко А.Б., Угольницкий Г.А. Введение в моделирование эколого-экономических систем. Изд-во Рост. ун-та, 1990. 112 с.
4. Мулен Э. Теория игр с примерами из математической экономики. М.: Мир, 1985. 200 с.
5. А.Э. Назиров, А.Б. Усов Моделирование трехуровневого канала распределения продукции // Инженерный вестник Дона, 2014, №2. URL: ivdon.ru/ru/magazine/archive/n2y2014/2393
6. Розин М.Д., Сущий С.Я., Угольницкий Г.А. и др. Дескриптивный подход к моделированию коррупции как фактора социальной конфликтности // Инженерный вестник Дона, 2011, №3. URL: ivdon.ru/ru/magazine/archive/n3y2011/561
7. Мальсагов М.Х., Угольницкий Г.А. Дифференциально-игровые модели коррупции при распределении ресурсов // Инженерный вестник Дона, 2018, №2. URL: ivdon.ru/ru/magazine/archive/N2y2018/4984
8. M. Intriligator Mathematical optimization and economic theory. New York: Prentice Hall, 1971. 529 p.
9. Fan L.T., Wang C.S. The discrete maximum principle. New York: John Wiley and Sons, Inc., 1964. 256 p.
10. Максимей И.В. Имитационное моделирование на ЭВМ. М.: Радио и связь, 1988. 232 с.
References
1. Kurbatov V.I., Ugol'nickij G.A. Matematicheskie metody social'nyh tehnologij [Mathematical methods of social technologies]. M.: Vuzovskaja kniga, 1998. 256 p.
2. Gorelik V.A., Kononenko A.F. Teoretiko-igrovye modeli prinjatija reshenij v jekologo-jekonomicheskih sistemah [Game-theoretic models of decision making in environmental-economic systems]. M.: Radio i svjaz', 1982. 144 p.
3. Gorstko A.B., Ugol'nickij G.A. Vvedenie v modelirovanie jekologo-jekonomicheskih sistem [Introduction to Modeling Ecological and Economic Systems]. Izd-vo Rost. un-ta, 1990. 112 p.
4. Mulen Je. Teorija igr s primerami iz matematicheskoj jekonomiki [Game theory with examples from mathematical economics]. M.: Mir, 1985. 200 p.
5. A.Je. Nazirov, A.B. Usov Inzenernyj vestnik Dona (Rus), 2014, №2. URL: ivdon.ru/ru/magazine/archive/n2y2014/2393
6. M.D. Rozin, S.Ja. Sushhij, G.A. Ugol'nickij i dr. Inzenernyj vestnik Dona (Rus), 2011, №3. URL: ivdon.ru/ru/magazine/archive/n3y2011/561
7. Mal'sagov M.H., Ugol'nickij G.A Inzenernyj vestnik Dona (Rus), 2018, №2 URL: ivdon.ru/ru/magazine/archive/N2y2018/4984
8. M. Intriligator Mathematical optimization and economic theory. New York: Prentice Hall, 1971. 529 p.
9. Fan L.T., Wang C.S. The discrete maximum principle. New York: John Wiley and Sons, Inc., 1964. 256 p.
10. Maksimej I.V. Imitacionnoe modelirovanie na JeVM [Computer Simulation]. M.: Radio i svjaz', 1988. 232 p.