УДК 621.306
ТЕОРЕТИКО-ИГРОВЫЕ ПРИНЦИПЫ ОПТИМИЗАЦИИ УПРАВЛЕНИЯ ПРОЦЕССАМИ ФУНКЦИОНИРОВАНИЯ СИСТЕМЫ КОСМИЧЕСКИХ СРЕДСТВ СОЦИАЛЬНО-ЭКОНОМИЧЕСКОГО И НАУЧНОГО НАЗНАЧЕНИЯ
© 2011 г. Ю.Н. Макаров
Московская академия рынка труда Taganrog Institute of Technology,
и информационные технологий Southern Federal University
Рассмотрена конфликтная ситуация функционирования системы космических средств социально-экономического и научного назначения. На основе её анализа сформулированы принципы теоретико-игровой оптимизации управления этой системой. Приведён пример построения модели игровой ситуации в виде смешанного расширения матричной игры неклассического типа.
Ключевые слова: конфликт; теория игр; смешанное расширение матричныгх игр неклассического
The conflict situation of system functioning space means of social-economic and scientific appointment is considered. On the basis of its analysis management game-theoretical principles optimization are formulated by this system. The example of a game situation model in the form of non-classical type matrix game is resulted.
Keywords: ^e conflict; the theory of games; the mixed expansion of nonclassical type matrix games.
При построении научных теорий и для решения научных проблем формулируются принципы как основное начало, на котором построена научная система, теория, устройство и т. п. [1]. Особенно важными являются такие основные положения в системном анализе, в частности для построения и развития теории принятия решений в условиях конфликта.
Как известно, понятие конфликта является категорией теории игр. При математическом обеспечении практических задач в теории игр рассматриваются три аспекта: концептуальный, модельный и информационный [2]. На уровне концептуального аспекта математического обеспечения определяются понятия игроков (сторон конфликта), стратегий (способов их действия) и выигрыша (оценки складывающейся ситуации). Кроме того, формируется понятие оптимальности как формального представления некоторого синтеза содержательных понятий выгодности, устойчивости и справедливости [2, 3]. Дальнейшее уточнение понятия игры осуществляется на уровне модельного аспекта, на котором путём наложения дополнительных более конкретных условий формируются теоретико-игровые модели, определяющие классы игр. На уровне последнего аспекта осуществляется последовательная, и в идеале — полная индивидуализация игры.
Процесс построения игры для практических конфликтных ситуаций является сложным. Кроме того, обоснование информированности сторон конфликта ещё больше усложняет задачу построения адекватной модели.
Для систематизации применения игрового подхода при решении теоретических и практических задач, в которых в качестве объектов рассматриваются сложные технические (организационно-технические) системы, необходимо построение теоретико-игровых принципов процесса оптимизации управления деятельностью, связанной с ними.
Отечественная космическая деятельность направлена на наиболее полное удовлетворение потребностей федеральных органов исполнительной власти, ведомств, организаций и населения страны в информации и услугах, предоставляемых только с помощью космических средств.
В условиях жёстких экономических ограничений цели и задачи космической деятельности для обеспечения конкурентоспособности должны строго соответствовать потребностям социально-экономической сферы, науки, международного сотрудничества России, а также должны учитывать потребности многочисленных и разнородных отечественных и зарубежных потребителей. Таким образом, с точки зрения системного анализа (или его отдельной дисциплины — теории
принятия решений) в рамках рассматриваемой проблемной ситуации необходимо учитывать большое число неконтролируемых со стороны ЛПР факторов. К ним можно отнести [4]: многовариантность выбора космических средств, предназначенных для длительного использования в экстремальных условиях и оснащённых аппаратурой с предельно достижимыми уровнями чувствительности, стойкости и производительности; привлечение многочисленных коопераций для их создания; необходимость координации всех этапов жизненных циклов создания и развития космических средств; высокие темпы морального старения техники в условиях бурного научно-технического прогресса; наукоёмкость космических средств, связанная с использованием новых передовых технологий; необходимость сбалансированного развития орбитальных средств, средств выведения и эксплуатации, запуска и управления, других обеспечивающих средств, а также удовлетворение потребностей в космических средствах и услугах различных потребителей при минимальных затратах.
Многие из этих факторов не имеют достаточного (со статистической точки зрения) вероятностного описания и требуют их учёта как неопределённых. Это, в свою очередь, приводит к необходимости опоры на логические построения, соответствующие случаям разумной конкуренции, «игры с природой» и другим, формализуемым понятиям конфликта.
Конфликтная ситуация, связанная непосредственно с системой космических средств (СКСр), является сложной во всех отношениях: дескриптивном, нормативном, конструктивном и прогностическом [2]. В той или иной мере она рассматривалась в [5, 6]. Так, в [5] рассмотрена теоретико-игровая оптимизация управления информационной системой в режиме наблюдения одного динамического объекта — одиночного космического средства (КСр), отмечено, в частности, что в зависимости от ограничения на реализацию управления КСр можно ставить задачу оптимизации либо информационных помех, либо манёвра наилучшей скрытности.
Однако рассмотренные частные задачи не позволяют построить адекватную модель игровой ситуации с наиболее общих позиций, учитывая многогранность решаемых задач в процессе функционирования СКСр. Например, со стороны информационной системы могут решаться по сути две задачи — поиск новых объектов и наблюдение за найденными КСр. Кроме того, в практическом плане модель игры должна обеспечивать синтез оптимального управления объектами конфликтующих сторон, реализуемого произвольное количество раз (в том числе и малое). Поэтому
построение теоретико-игровых принципов процесса оптимизации управления СКСр является актуальной задачей.
Рассмотрим следующую постановку задачи. Пусть в конфликтной ситуации первый игрок управляет СКСр социально-экономического и научного назначения, а остальные — некоторыми объектами или неопределёнными факторами, связанными с СКСр и влияющими на эффективность её функционирования. Число реализаций игровой ситуации — произвольное. Требуется на основе анализа исходной системы базовых теоретико-игровых понятий и процессов рассматриваемой конфликтной ситуации сформировать теоретико-игровые принципы оптимизации управления СКСр.
Проведём анализ конфликтной ситуации и построим сначала принципы, соответствующие концептуальному аспекту математического обеспечения теоретико-игровых задач. Для этого введём обозначения.
Конфликт — всякое явление, в котором отражены следующие компоненты: заинтересованные стороны, возможные действия каждой из сторон, интересы сторон.
В теории игр заинтересованные стороны называются игроками. Обозначим через I — мно-
^ ^ игр
жество игроков, через i — номер игрока
(гигр е 1 игр ). Пусть /Игр - 1 пигр .
Любые возможные для игрока действия называются стратегией. Для ,игр-го игрока множество его
стратегий обозначим через Х,шр. В условиях конфликта каждый игрок гигр е 1игр выбирает неко-
торую свою стратегию
, в результате
чего складывается набор стратегий игроков
х - {х1,..., х"игр}, называемый ситуацией.
Интересы сторон (игроков) в ситуациях проявляются в том, что каждому , -му игроку в каждой ситуации х - {х1,...,х"игр} приписывается число Н1 (х), выражающее степень удовлетворения его интересов в этой ситуации. Это число называется выигрышем игрока , в ситуации х. Функция, определённая на множестве стратегий игрока и множестве ситуаций для него, называется функцией выигрыша.
Таким образом, всякий конфликт в самом общем виде может быть представлен в виде следующей системы множеств:
{I^r-b eI ,{Ht (x)}i eI }.
(1)
Непосредственно из постановки задачи следует, что в игре принимают участие произвольное
количество игроков: 1) произвольное число неопределённых факторов, влияющих на эффективность функционирования СКСр; 2) эти факторы могут принимать различные значения, а со стороны СКСр имеется возможность управления функционированием, т. е. имеются множества возможных действий сторон; 3) непосредственно для каждой из сторон конфликта возможно введение показателей эффективности, выражающих степень удовлетворения сторон конфликта, что приводит к определению на множестве их стратегий и ситуаций функций выигрыша.
Таким образом, выражение (1) полностью описывает конфликтную ситуацию, связанную с функционированием СКСр. Однако непосредственно на его основе невозможно построить модели конфликтных ситуаций для получения практических результатов. Нужна конкретизация. Она должна быть проведена на основе одного из элементов (1).
Анализ показал, что поскольку целью построения теоретико-игровых принципов является оптимизация управления СКСр, то ведущая роль в процессе формирования спектра практически важных моделей игровых ситуаций принадлежит множеству стратегий первого игрока, т. е. множеству возможных управлений СКСр. Упорядочивание этого множества приводит к необходимости введения принципа иерархичности управления СКСр.
Принцип иерархичности управления СКСр: управление СКСр имеет иерархическую структуру. На высшем — государственном уровне — это управление реализуется на основе Федеральных космических программ. На более низких иерархических уровнях осуществляется управление техническими системами и конкретными устройствами СКСр. Каждому уровню управления СКСр соответствуют неопределённые факторы, рассматриваемые как игроки в конфликтной ситуации, со своими множествами стратегий. Учёт только этих факторов и множеств для формирования модели игровой ситуации возможен на основе принципа абстрагирования модели конфликтной ситуации: для построения модели конфликтной ситуации функционирования СКСр необходимо выделение абстрактных ситуаций, характеризуемых некоторым (неполным) набором неопределённых факторов, наиболее существенных для конкретной решаемой задачи.
Его введение и обоснование связано с двумя взаимосвязанными категориями философии и логики: тождество и различие [8]. При определении понятий этих категорий используют два фундаментальных принципа: принцип индивиду-ации и принцип тождественно неразличимых. Согласно принципу индивидуации, всякая вещь
универсума обладает уникальными чертами. Из этого принципа вытекает проблема универсалий, которая формулируется в следующем виде: каким образом неповторимые индивиды содержат в себе нечто общее, т. е. можно ли считать свойство тождественности реальным, если каждая вещь имеет своеобразие. Благодаря появлению понятия абстрактного объекта, проблема универсалий стала решаемой. Абстрактным объектом называется реальный объект, характеризуемый по какому-нибудь одному свойству. Поскольку нет двух действительно тождественных вещей, путем абстрагирования выделяются такие объекты, в которых можно актуально установить тождество. Для абстрактных объектов Лейбниц ввел принцип тождественно неразличимых: один объект тождественен второму, если и только если все свойства одного и второго объекта являются общими. Таким образом, тождество двух реальных объектов определяется на основании их общего признака, различие двух реальных объектов— исходя из наличия индивидуального признака. В зависимости от выделяемых признаков между одними и теми же объектами имеет место как тождество, так и различие. С этих позиций познание свойств реальных конфликных ситуаций функционирования СКСр может быть интерпретировано как выявление в них тождества и различия, классифицирующих их по различным признакам.
Таким образом, применение принципов иерархичности управления СКСр и принципа абстрагирования позволяет получать практические модели игровых ситуаций.
Анализ степени удовлетворения интересов первого игрока в конфликтной ситуации, исходя из иерархичности управления, приводит к введению принципа иерархии целей, определяемых нормативно. Так для Федеральной космической программы (ФКП), как высшему иерархическому уровню управления, нормативные требования определяются, например, постановлением Правительства РФ от 25 декабря 2004 г. № 842 «О внесении изменений в порядок разработки и реализации федеральных целевых программ и межгосударственных целевых программ, в осуществлении которых участвует Российская Федерация». В частности, установлено, что «разрабатываемые федеральные целевые программы должны содержать описание социальных, экономических и экологических последствий, которые могут возникнуть при реализации программы, общую оценку вклада целевой программы на экономическое развитие, а также оценку эффективности расходования бюджетных средств. Оценка эффективности осуществляется по годам или по этапам в течение всего срока реализации целевой программы». Степень достижения цели
определяется на основе достижения определённых показателей эффективности. При многокритериальной модели предпочтения ЛПР используются методы принятия решений в условиях многокри-териальности, например, метод составления суперкритерия с аддитивным включением частных критериев. Для оценки эффективности ФКП методика такой оценки разрабатывается государственными заказчиками (государственными заказчиками-координаторами) с учётом специфики программы и служит приложением к тексту программы. В настоящее время разработана и действует Федеральная космическая программа России на 2006-2015 гг. (ФКП-2015).
Из анализа составляющей модели конфликта {Нигр (х)}'игре/игр вытекает принцип разумности сторон конфликтной ситуации: каждая из сторон конфликта преследует некоторые цели и для их достижения стороны конфликта реализуют доступные стратегии. Из этого принципа, в частности, следует, что для ситуаций, определяемых как «игра с природой», отсутствие цели у «природы» ведёт к её искусственному формированию, обеспечивающему противоположность интересов игроков.
Частным, но практически важным случаем является результат применения рассмотренных принципов в виде формирования моделей конфликтов с двумя сторонами.
В этом случае на концептуальном уровне следует определить, являются ли интересы игроков противоположными или нет. Вне зависимости от определяемых в дальнейшем функций выигрышей игроков противоположность интересов подразумевает, что выигрыш одного игрока есть проигрыш второго. Сформулируем и обоснуем применение принципа антагонистичности интересов игроков для процессов функционирования СКСр социально-экономического и научного назначения: конфликтной ситуации в системе «СКСр — природа» соответствует антагонистическая оценка складывающейся ситуации игроками. Применение сформулированного принципа целесообразно исходя из того, что рассматривается задача теоретико-игровой оптимизации управления СКСр и если модель предпочтения второго игрока (природы) будет нестрого антагонистической, то и реализуемые стратегии будут отличаться от оптимальных, и, следовательно, выигрыш первого игрока будет выше.
Следует отметить, что антагонистичность интересов игроков может существовать и не только в играх, определяемых системой «СКСр — природа». К ней приводит, например, жёсткая конкуренция в коммерческой сфере при функционировании СКСр, а также рассмотрение вопросов функционирования СКСр военного назначения.
Непосредственно с принципом антагонистичности интересов игроков связан принцип одно-
критериальной оценки сложившейся ситуации: оценка сложившейся ситуации в игре «СКСр — природа» должна быть сведена к однокритериаль-ной. Действительно, со стороны первого игрока ситуация оценивается по многим критериям, характеризующим процессы функционирования СКСр. Однако применение процедур многокритериального выбора, например на основе множеств Парето, уменьшает возможность точного выражения предпочтений игроков (невозможно учесть предпочтительность по относительной важности частных критериев) и может быть использовано только на предварительном этапе оптимизации для сужения исходного множества стратегий игроков за счёт отбрасывания заведомо худших. Переход к однокритериальной оценке ситуации в игре может быть осуществлён на основе стандартных подходов, описанных в [7].
На уровне концептуального аспекта также должны быть определены некоторые структурные свойства игры. Для их определения рассмотрим принцип несимметричности игры: игровая ситуация в системе «СКСр — природа» для игроков является несимметричной. Несимметричность вытекает из анализа информированности игроков и возможностей их влияния на игровую ситуацию. В таблице приведены результаты анализа информированности и возможностей игроков для конфликтной ситуации одного из этапов функционирования СКСр — поиск и устранения неисправности.
Анализ информированности и возможности игроков на этапе поиска и устранения неисправностей
Элементы игровой Информированность и возможности
ситуации игроков
Первый игрок Второй игрок (природа)
Начало игры Не может влиять Инициатор,
(косвенное влияние определяет число
посредством реализаций игровой
системы ситуации
технического
обслуживания)
Факторы, влияющие Управление Управление
на оценку стратегиями поиска возникновением
результатов игры и устранения неисправностей неисправности
Оценка Возможна Не возможна
применяемой
противником
стратегии
Оценка реальных Возможна Не возможна
результатов игры
после реализации
игровой ситуации
Перейдём к модельному аспекту математического обеспечения решения задачи теоретико-игрового синтеза оптимального управления СКСр. Для этого аспекта характерно [2] выделение моделей путём наложения на компоненты игры дополнительных более конкретных условий, имеющих качественный характер. Ясно, что исполь-
зование рассмотренных выше принципов при наложении различных дополнительных ограничений приведёт к различным моделям. Остановимся на построении модели, обеспечивающей достаточно простую реализацию при сохранении адекватности конфликтной ситуации. Для этого ограничимся классами игр с конечными множествами стратегий игроков. Последнее можно обосновать следующим образом, опираясь на принцип несимметричности игры. Поскольку второй игрок в процессе развития конфликтной ситуации не может оценить применяемую противником стратегию, а после реализации игровой ситуации — её реальных результатов, то выбор своих стратегий, рассматриваемых в игровой ситуации, он производит априорно, без внесения изменений в процессе развития конфликта. Число возможных стратегий теоретически бесконечно, но среди них можно оставить только «характерные». Принцип выбора «характерных» стратегий может быть основан на том факте, что значения показателей эффективности СКСр зависят от возникновения конкретной неисправности, но при этом не меняются существенно при малых вариациях. Таким образом, может быть сформировано конечное множество стратегий управления второго игрока. Построение такого множества доступно и для первого игрока, который на его основе может построить своё множество стратегий, определяя их как оптимальные по отношению к стратегиям второго игрока. Следовательно, с одной стороны точность, а с другой — простота модели будут зависеть от размерности множеств стратегий игроков.
Поскольку только второй игрок определяет число реализаций игровой ситуации и это число может быть произвольным, то модель игры должна оставаться адекватной как при большом, так и при малом числе реализаций игры. Учтём это требование в принципе согласованности: модель игры для системы «СКСр — природа» должна учитывать число реализаций игровой ситуации.
Рассмотрим применение теоретико-игровых принципов оптимизации управления СКСр на примере задачи поиска и устранения неисправности КСр с дальнейшей конкретизацией игры.
Пусть имеется КСр, состоящее из нескольких подсистем. Рассматривается неисправность КСр определённого типа и случай отсутствия кратных неисправностей. Эта неисправность КСр может быть вызвана одной из т причин, каждая из которых связана с отказами подсистем КСр. Вероятности возникновения причин неисправности КСр неизвестны (что соответствует, например, начальному этапу эксплуатации). Для рассматриваемого типа неисправности КСр в случае её возникновения имеется п возможных алгоритмов
поиска причин её возникновения и их устранения. Интенсивности поиска причин неисправности и их устранения Xу для каждого /-го алгоритма (/ = 1, п) и каждой у-й причины (у = 1, т )
известны и представлены в виде матрицы Л . Поскольку вероятности возникновения причин неисправности КСр неизвестны, то для определения эффективной стратегии её поиска и устранения можно использовать модель матричных игр
с матрицей игры А = Л и, соответственно,
ау = ху , / = 1, п, у = 1, т .
Применим к этой задаче принципы антагонистичности интересов игроков, несимметричности игры и согласованности.
Так как ввиду несимметричности игровой ситуации только второй игрок определяет число реализаций игровой ситуации, то для согласованности модели игры с реальной ситуацией в условиях неопределённости оптимальность реализуемых им стратегий должна рассматриваться с позиций критерия Ходжа—Лемана (критерий ИЬ) [7]. Этот критерий является производным от минимаксного (ММ) критерия и критерия Бай-еса—Лапласа (ВЬ). Он позволяет за счёт параметра в более гибко подходить к учету интересов второго игрока при изменении числа реализаций игры. Так, при малом числе реализаций, когда велика вероятность получения среднего выигрыша меньше гарантированного, значение в =0 обеспечивает оптимальность реализуемых стратегий в соответствии с ММ-критерием. При в =1 применение критерия HL будет соответствовать условиям применения критерия ВЬ: 1) решение (игровая ситуация) реализуется (теоретически) бесконечно много раз; 2) для малого числа реализаций допускается риск (т. е. второго игрока интересует не выигрыш в каждой отдельной партии, а суммарный или средний выигрыш за все партии).
Таким образом, исходя из возможности получения оценок эффективности процесса поиска и устранения неисправности в виде элементов матрицы А и требования принципа согласованности на применение вторым игроком критерия Ходжа—Лемана, в качестве основы модели игровой ситуации в системе «СКСр — природа» можно использовать аппарат смешанного расширения матричных игр неклассического типа, разработанный в [9].
Для этого определим множества М^ е Яп и Мп е Ят , являющиеся множествами смешанных стратегий X = ^2-^п)Т , У = (П1 П2-Пт)Т в
исходной матричной игре соответственно для первого и второго игроков, т. е.
М% = |х = (^1 %2 ... %п)т :^ 0, / = ~п, £% = Л;
Мп =у = (П1 П2-Пт)Т :Пу ^ 0,у = 1,т, ^пу = 1|.
Тогда для каждой чистой стратегии второго игрока, принадлежащей спектру, выполняется равенство
ßX агу* hi + (1 - ß) max ay* =
i=1 i n
= min{ßX at hi + (1 - ß) max <
(2)
i=1
где j* = {j : n j > 0}, в — параметр критерия HL (при этом критерий Ходжа—Лемана будем обозначать HLp), в общем случае ре [0; 1].
Если обозначить проигрыш второго игрока в
виде - H2 (X, Y, Р), то выигрыш первого игрока составит
H i (X, Y, р) = -H 2 (X, Y, р) = H (X, Y, р), (3)
где H i(X ,Y, р) — выигрыш первого игрока.
Пусть модель предпочтения, выбранная первым игроком для второго игрока, совпадает с моделью предпочтения, принимаемой вторым игроком.
Поскольку для всех А, X, Y и р , определённых выше, справедливо соотношение [9]
n
тт{рУ а. ^ + (1 - р) max ау} =
j ы J 1
n m m
= т1п{рХХп jav hi+(1 - р)Хп jmax aij}, (4)
i=1 j=1
j=1
то функция выигрыша первого игрока, которую второй игрок стремится минимизировать, пред-ставима в виде
U Iii
HEI}(X, Y, ß) = ßXXn jüj hi
i=1 j=1
tri
+ (1 -ß)Xn j maxa,j.
(5)
Тогда согласно (1)—(5) модель игровой ситуации в системе «СКСр — природа» в задаче поиска и устранения неисправности соответствует смешанному расширению матричной игры неклассического типа, основанному на использовании критерия ИЬр вторым игроком (ИЬ2), т. е. модель игры формируется тройкой
ГА(HIß2) =<Mh,Mn,hHI2 >
(6)
j=1
Нахождение оптимальных смешанных стратегий для (6) можно осуществить с помощью построения и решения двойственных задач линейного программирования или модифицированного итерационного метода Брауна [9, 10]. Условия применения этой модели игры в зависимости от числа реализаций можно определить на основе анализа вероятностей получения игроками результатов хуже гарантированных.
Таким образом, сформулированные теоретико-игровые принципы процесса оптимизации управления СКСр позволяют учесть специфику связанных с их функционированием конфликтных ситуаций, а их применение даёт возможность на регулярной основе строить адекватные игровые модели.
Литература
1. Толковый словарь русского языка: в 4 т. /под ред. Д. Н. Ушакова. М., 1935-1940.
2. Воробьёв Н. Н. Теория игр для экономистов-кибернетиков. М., 1985. 272 с.
3. Вилкас Э. Й. Оптимальность в играх и решениях. М., 1990. 256 с.
4. Новые концептуальные методологические подходы к проблемам формирования оптимального технического и технологического базиса программно-целевого планирования в создании и развитии ракетно-космической техники /В.А. Давыдов, Ю.Н. Макаров, А.Н. Мальченко, Д.Б. Пайсон. М., 2006.
5. Малышев В. В., Красильщиков В. И., Карлов В. И. Оптимизация наблюдения и управления летательных аппаратов. М., 1989. 312 с.
6. Колмановский В. Б., Черноусько Ф. Л. Оптимизация помех при наблюдении за динамической системой // Изв. АН СССР. Техн. кибернетика. 1972. № 2. С. 170—177.
7. Мушик Э., Мюллер П. Методы принятия технических решений. М., 1990. 250 с.
8. Новейший философский словарь: 3-е изд., ис-правл. Минск, 2003.1280 с. (Мир энциклопедий).
9. Макаров Ю. Н., Строцев А. А. Методология исследования сложных организационно-технических систем, функционирующих в конкурентной среде при ограниченных ресурсах: монография. Ростов н/Д, 2010. 132 с.
+
10. Актуальные проблемы неразрушающего кон- ров, А. А. Лухвич , В. Г. Шипша [и др].: монография. троля качества космической техники / Ю. Н. Мака- СПб., 2008. 333 с.
Поступила в редакцию 19 октября 2010 г.
Макаров Юрий Николаевич — канд. техн. наук, профессор, Московская академия рынка труда и информационных технологий. Тел. (495) 631-93-15. E-mail: arm415@ roscosmos.ru
Makarov Yury Nikolaevich — Candidate of Technical Sciences, professor, The Moscow academy of a labour market and information technology. Те1. (495) 631-93-15. E-mail: arm415@ roscosmos.ru