Кооперативно-игровое моделирование социального партнерства в системе дополнительного профессионального образования: постановка
задачи
В.К. Дьяченко, Л.В. Тарасенко, Г.А. Угольницкий Южный федеральный университет, Ростов-на-Дону
Аннотация: Предлагается динамическая кооперативно-игровая формализация задачи согласования интересов субъектов социального партнерства в системе дополнительного профессионального образования на основе рассмотренных ранее дифференциально-игровых моделей в нормальной форме. Обсуждается проблема динамической устойчивости решения игры и ее социологическая интерпретация.
Ключевые слова: дифференциальные игры в нормальной форме, дифференциальные кооперативные игры, динамическая устойчивость, дополнительное профессиональное образование, социальное партнерство.
Введение
Под социальным партнерством в сфере дополнительного профессионального образования (далее ДПО) понимается особая система совместной деятельности субъектов образовательного процесса, характеризуемая доверием, общими целями и ценностями и обеспечивающая подготовку высококвалифицированных, конкурентоспособных и мобильных специалистов на рынке труда. Имеется ряд работ, посвященных исследованию и моделированию социального партнерства, в том числе в системе образования [1-3]. В авторских публикациях [4-6] предложен подход к моделированию проблемы согласования интересов субъектов социального партнерства, основанный на математическом аппарате дифференциальных игр в нормальной форме [7-8].
В настоящей работе рассматривается постановка задачи перехода от указанных моделей к кооперативным дифференциальным играм (в форме
характеристической функции) [9-11]. При этом на первый план выходят вопросы формирования коалиций игроков, распределения между игроками выигрыша максимальной коалиции и проблема динамической устойчивости принципов оптимальности кооперативной игры, решаемая с помощью предложенной Л. А. Петросяном процедуры регуляризации.
Постановка задачи согласования интересов субъектов социального партнерства как дифференциальной игры в нормальной форме
В исходной модели рассматривается социальное партнерство между тремя субъектами управления - преподаватель ВУЗа (В), работодатель (Р), студент (С). Сначала предполагается, что стремящиеся к максимизации своего выигрыша субъекты равноправны и принимают решения одновременно и независимо. Дифференциально-игровая модель имеет вид:
T
J = Je[g (r - Ui (t)) + ^ (t)c(x(t))]dt + e~pTst (T)c(x(T)) ^ max, (1)
0
0 < щ (t) < r, i £ N; (2)
x = h(x(t)) + f (uB (t), uP (t), uc (t)), x(0) = X0. (3)
В представленной модели согласования общественных и частных интересов (СОЧИ-модели) считается, что каждый субъект i из множества N = {B, P, C} распределяет свой бюджет ri между двумя направлениями: доля щ (t) (управление игрока) ассигнуется на повышение уровня профессиональной подготовки студентов, а оставшаяся часть ri - ui (t)
используется для финансирования частной деятельности, не связанной с образованием. Соответственно, текущий выигрыш игрока складывается из доходов от частной деятельности и полезности от уровня профессиональной подготовки студентов (доли от выигрыша общества). Итак, в модели (1) - (3) gt (z) - вогнутая возрастающая функция переменной z, отражающая доходы
субъектов от частной деятельности; x(t) - уровень профессиональной
подготовки студентов (переменная состояния); с(х)- вогнутая возрастающая функция, дающая финансовое выражение общественной полезности от уровня профессиональной подготовки; si (г)- доля субъекта в этой
полезности; к - убывающая функция, отражающая снижение уровня подготовки при отсутствии инвестиций; / - возрастающая функция инвестиций субъектов в профессиональную подготовку студентов.
Для аналитического исследования рассмотрена линейная по состоянию [7] упрощенная версия СОЧИ-модели (1) - (3), которая имеет вид
т
J1 = | е[кг (гг - иг (г)) Р + (г)сх(г)]^ + е~рт(Т)сх(Т) ^ тах, (4)
о
0 < иг (г) < гг, г е N; (5)
х = ах(г) + X Ъiui (г), х(0) = х0. (6)
iеN
В (4) - (6) по сравнению с моделью (1) - (3) используются линейная функция с(х(г)) = сх(г), где с > 0 - коэффициент перевода уровня профессиональной подготовки в общественную полезность, и линейная функция к(х(г)) = ах(г), а < 0, что делает модель линейной по состоянию. Далее, для простоты используется линейная функция /(ив(г),ир(г),ис (г)) = ХЪщ г (г),
iеN
где Ъi > 0 - доля вклада инвестиций игрока в повышение уровня подготовки, и степенная функция дохода от частной деятельности § г (г - иг (г)) = к (г - и. (г))Рг, к1 > 0, 0 < Рг < 1.
Для решения игры (4) - (6) применим принцип максимума Понтрягина. Функция Гамильтона г -го игрока имеет вид [7]
И1 (щ (г), А (г), х(г), г) = к (г - и. (г))Рг + (г)х(г) + А (г)[ах(г) + X Ъ]и] (г)].
jеN
Из условия дИ1 / дщ = 0 с учетом неотрицательности ui (г) находим
и ^) = 1
Т -
Щ)
V кгРг J
0,
Р'-1 Л 1 ^ к(р( Р -1
ж«) > кЬтгР-1.
ь'
(7)
Сопряженная переменная вычисляется по формуле
Д (Г) = е(р-а»-т)csг (Т) + е(р-а)(1-т) |с^ (т)е(р-а)(Т-т)ёт ,' е N.
(8)
В силу свойств модели (4) - (6) соотношения (7) с учетом (8) действительно образуют равновесие Нэша иш (•) = (и™ (•), и^ (•), и™ (•)) в этой
модели. Соответствующая равновесная траектория есть
хш (г) = х0еа + { еа(Г-т)
I (т)
iеN
ёт.
(9)
Теперь рассмотрим кооперативную модель, когда все субъекты объединяются и совместно максимизируют суммарный функционал выигрыша
1
3 = 1 '/г = / е[I кг (г - щ (0)Рг + сх(т + е-рТ сх(Т)
(10)
геЫ
геN
(с учетом условия Vt 15г (г) = 1) по всем управлениям (5) в силу уравнения
геЫ
динамики (6). В этом случае получаем Парето-оптимальное решение
иРО (•) = (•), и;° (•), иро (•)), где
РО г \ „ РО г \ . РО ,
иРО ^) = 1
' ЬД) ^ Р-1 _ ^к1р1гр1 -
Т -
кгР
V пгУг
0 <Д(t) <_р т}
, ге N;
кгРг тр1 -1
(11)
0, жо >-р т ь
ДРО ^) = се(Р-а)а-Т) + е(Р-а)а-Т) | се(Р-а)(т-т)ёт .
(12)
Оптимальная кооперативная траектория хРО ^) есть (9) в силу (11) - (12).
1
Переход к играм в форме характеристической функции и динамическая
устойчивость
При кооперативной постановке игры, заключающейся в совместной максимизации суммарного функционала выигрыша (10), основная задача состоит в распределении выигрыша максимальной коалиции между игроками. Для этого строится характеристическая функция, сопоставляющая каждой коалиции (подмножеству игроков) ее выигрыш [11].
Есть три основных способа построения кооперативной игры в форме характеристической функции на основе игры в нормальной форме [10]. Классический подход предложен Дж. фон Нейманом и О. Моргенштерном: в этом случае
v(K) = supmf 2 J (uk , un\k ), (13)
UK "NKigK
где uK - вектор стратегий игроков, входящих в коалицию K, а uNхK - вектор стратегий участников дополнительной коалиции N\K. Доказано, что функция (13) супераддитивна, т.е. K n L = 0 ^ v(K u L) > v(K) + v(L). Однако, в реальных приложениях совсем не очевидно, что если несколько игроков образуют коалицию, то остальные должны играть строго против них. В частности, при рассмотрении социального партнерства это не так. Поэтому Л. А. Петросян и Ж. Заккур [9] предложили новую характеристическую функцию
v(K) = sup 2 J (Uk , uNek ), (14)
uk ieK
где игроки из коалиции K максимизируют свой суммарный выигрыш, а остальные используют равновесные по Нэшу стратегии (согласно формуле (7) в рассмотренной модели). К сожалению, характеристическая функция (14) может не быть супераддитивной, что нарушает основной принцип кооперативных игр "объединяться выгодно". Чтобы обойти этот недостаток, Е.В. Громова и Л. А. Петросян [10] ввели характеристическую функцию v(K) = inf 2 J (uKO, Unk ), (15)
UNK igK
где участники коалиции К используют свои кооперативные стратегии (согласно формуле (11) в рассмотренной модели), и доказали, что функция (15) супераддитивна. Заметим, что во всех случаях (13)-(15)
ЧN) = £ Jt (иРО) = JPO . (16)
iеN
Среди возможных решений игры в форме характеристической функции одним из наиболее распространенных считается вектор Шепли, который всегда существует и единствен [11]. Это решение определяется формулой
фг (V) = X у(к)[^(К) - у(К \ {г}], у(к) = (к - 1)!(п - к)!/ п!, к =| К |, п =| N |, г е N . (17)
{г}еК
Для обеспечения динамической устойчивости вектора Шепли (17) используется предложенная Л. А. Петросяном процедура регуляризации
г
ф г (г) = | вг (s)ds, г е N, г е [0, Т], (18)
0
где вектор в(г) = (в1(г),... , вп (г)) определяет распределение суммарного мгновенного выигрыша между игроками из множества N = {1,..., п} [11]. Правильный выбор в(г) обеспечивает стабильность первоначального соглашения о распределении по Шепли на протяжении всего периода [0, Т ].
Заключение
Дифференциальные игры представляются адекватным математическим аппаратом моделирования социального партнерства как процесса, обладающего конфликтными и кооперативными чертами. Согласование интересов субъектов социального партнерства в системе ДПО отражено СОЧИ-моделью, имеющей специфическую структуру. Линейная по состоянию СОЧИ-модель допускает аналитическое решение как для независимого, так и для кооперативного поведения игроков.
После нахождения оптимального кооперативного решения задачи возникает вопрос о распределении суммарного выигрыша между игроками. Для этого естественно использовать игры в форме характеристической
функции (кооперативные игры). Основными действующими субъектами кооперативных игр выступают коалиции, то есть подмножества игроков, образование которых допускает ясную интерпретацию. Так, в рассмотренной модели коалиция студента и работодателя может трактоваться как корпоративная программа повышения квалификации; студента и ВУЗа - как реализация программ ДПО, предлагаемых ВУЗом; работодателя и ВУЗа - как заказ ВУЗу на разработку программ ДПО, востребованных предприятием, и т.п. Значение характеристической функции описывает выигрыш коалиции от кооперации, причем в силу супераддитивности этот выигрыш увеличивается с ростом числа участников коалиции и достигает максимума при полной кооперации всех субъектов социального партнерства.
Идея вектора Шепли как принципа распределения выигрыша максимальной коалиции между всеми игроками состоит в оценке вклада каждого игрока во все коалиции с его участием: игрок получает тем больше, чем большую ценность он представляет для различных коалиций с учетом их размера. В динамической кооперативно-игровой постановке ключевую роль для любого принципа оптимального распределения играет его динамическая устойчивость, которая означает, что на протяжении всего времени действия первоначального соглашения о способе распределения никому из игроков не выгодно его нарушать. Ясно, что невыполнение этого свойства ставит под угрозу практическую реализуемость соглашения. Вместе с тем, принципы оптимальности в дифференциальных кооперативных играх могут не обладать динамической устойчивостью.
Для преодоления этого недостатка Л.А. Петросян предложил процедуру регуляризации решения, которая заключается в выплате игроку в каждый момент времени таких мгновенных выигрышей, что оставшаяся до конца периода доля совпадает с предписываемой принципом оптимальности (например, вектором Шепли). В этом случае игроки не имеют стимулов для
отклонения от первоначально принятого принципа оптимальности, то есть социальное партнерство можно назвать динамически устойчивым.
Когда дифференциальная кооперативная игра строится на базе игры в нормальной форме, для вычисления значений характеристической функции можно использовать найденные ранее равновесные по Нэшу и кооперативные решения, что позволяет далее построить решение и провести его регуляризацию. Применительно к модели социального партнерства в системе ДПО эта работа будет проделана в дальнейшем.
Работа выполнена при финансовой поддержке РГНФ, проект № 14-03-00236.
Литература
1. Keith N. Engaging in Social Partnerships: A Professional Guide for Successful Collaboration in Higher Education. Routledge, 2011. 288 p.
2. Siegel D. Organizing for Social Partnerships: Higher Education in Cross-Sector Collaboration. Routledge, 2010. 224 p.
3. Talman D., Yang Z. A model of partnership formation // Journal of Mathematical Economics, 47 (2011), рр.206-212
4. Тарасенко Л.В., Угольницкий Г.А., Дьяченко В.К. Динамическая модель профессиональной специализации студентов // Инженерный вестник Дона. 2013. №2. URL: ivdon.ru/magazine/archive/n2y2013/1653.
5. Тарасенко Л.В., Угольницкий Г.А., Дьяченко В.К. Модели кооперации в системе социального партнерства // Инженерный вестник Дона. 2013. №1. URL: ivdon.ru/magazine/archive/n1y2013/1555.
6. Dyachenko V.K., Ougolnitsky G.A., Tarasenko L.V. Computer Investigation of a Game Theoretic Model of Social Partnership in the System of Continuing Professional Education // Advances in System Science and Applications, 2015, 15(4), рр.378-387
7. Dockner E., Jorgensen S., Long N.V., Sorger G. Differential Games in Economics and Management Science. Cambridge University Press, 2000. 382 p.
8. Jorgensen S., Zaccour G. Differential Games in Marketing. Kluwer Academic Publishers, 2004. 176 p.
9. Petrosjan L., Zaccour G. Time-consistent Shapley value allocation of pollution cost reduction // Journal of Economic Dynamics and Control, 2003, 27(3), рр.381-398.
10. Громова Е.В., Петросян Л.А. Об одном способе построения характеристической функции в кооперативных дифференциальных играх // Математическая теория игр и ее приложения, 2015, 7(4), 19-39.
11. Петросян Л.А., Зенкевич Н.А., Шевпопляс Е.В. Теория игр. СПб., БХВ-Петербург, 2012. 432 с.
References
1. Keith N. Engaging in Social Partnerships: A Professional Guide for Successful Collaboration in Higher Education. Routledge, 2011. 288 p.
2. Siegel D. Organizing for Social Partnerships: Higher Education in Cross-Sector Collaboration. Routledge, 2010. 224 p.
3. Talman D., Yang Z. A model of partnership formation. Journal of Mathematical Economics, 47 (2011), pp. 206-212.
4. Tarasenko L.V., Ugol'nitskiy G.A., D'yachenko V.K., Inzenernyj vestnik Dona (Rus). 2013. №2. URL: ivdon.ru/magazine/archive/n2y2013/1653.
5. Tarasenko L.V., Ugol'nitskiy G.A., D'yachenko V.K., Inzenernyj vestnik Dona (Rus). 2013. №1. URL: ivdon.ru/magazine/archive/n1y2013/1555.
6. Dyachenko V.K., Ougolnitsky G.A., Tarasenko L.V. Computer Investigation of a Game Theoretic Model of Social Partnership in the System of Continuing Professional Education. Advances in System Science and Applications, 2015, 15(4), pp.378-387
7. Dockner E., Jorgensen S., Long N.V., Sorger G. Differential Games in Economics and Management Science. Cambridge University Press, 2000. 382 p.
8. Jorgensen S., Zaccour G. Differential Games in Marketing. Kluwer Academic Publishers, 2004. 176 p.
9. Petrosjan L., Zaccour G. Time-consistent Shapley value allocation of pollution cost reduction. Journal of Economic Dynamics and Control, 2003, 27(3), pp.381-398.
10. Gromova E.V., Petrosjan L.A., Matematicheskaja teorija igr i ee prilozhenija, 2015, 7(4), 19-39 pp.
11. Petrosjan L.A., Zenkevich N.A., Shevpopljas E.V. Teorija igr [Game theory]. SPb. BHV-Peterburg, 2012. 432 p.