Научная статья на тему 'Игры с интервальными параметрами'

Игры с интервальными параметрами Текст научной статьи по специальности «Экономика и бизнес»

CC BY
164
68
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по экономике и бизнесу, автор научной работы — Левин Виталий Ильич

The article looks at antagonistic games, the pay-matrices of which set to an approximation of the interval. Necessary and sufficient conditions are found out for the solution of such games. It is shown that the main theorem of von Neumann`s theory of games is invalid for such games. The author proposes a method of seeking out the solution of the interval game by turning it to two boundary point games.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

GAMES WITH INTERVAL PARAMETERS

The article looks at antagonistic games, the pay-matrices of which set to an approximation of the interval. Necessary and sufficient conditions are found out for the solution of such games. It is shown that the main theorem of von Neumann`s theory of games is invalid for such games. The author proposes a method of seeking out the solution of the interval game by turning it to two boundary point games.

Текст научной работы на тему «Игры с интервальными параметрами»

УДК 518.9

ИГРЫ С ИНТЕРВАЛЬНЫМИ ПАРАМЕТРАМИ

© В.И. Левин

Levin V.I. Games With Interval Parameters. The article looks at antagonistic games, the pay-matrices of which are set to an approximation of the interval. Necessary and sufficient conditions are found out for the solution of such games. It is shown that the main theorem of von Neumann’s theory of games is invalid for such games. The author proposes a method of seeking out the solution of the interval game by turning it to two boundary point games.

В настоящее время существует обширная литература, посвященная теории игр и ее приложениям. Подавляющая ее часть изучает игры с детерминированными параметрами (платежными матрицами). Однако на практике параметры игры никогда нельзя указать точно. Это связано с тем, что каждый такой параметр реально не определяется полностью стратегиями

участников игры, а зависит также от других обстоятельств. Например, в экономике результат игрового воздействия нескольких производителей некоторого товара, включенных в модель игры, реально зависит также от действий других производителей товара, не включенных в эту модель. Таким образом, возникает необходимость изучения игр с недетерминированными параметрами - случайными, нечеткими, интервальными и т.д. Решение игр с недетерминированными параметрами сложнее решения обычных игр, так как оно требует: 1) обобщения понятия седловой точки функции на недетерминированный случай; 2) выяснения условий существования седловой точки, связанных с недетерминированностью параметров функции; 3) разработки специальных методов поиска сед-ловых точек таких функций.

В настоящей работе намечен путь развития теории игр, в предположении недетерминированности параметров игр интервального типа. Это связано с тем, что интервальные оценки неизвестных параметров игр наиболее просты и доступны для получения. Предлагаемый подход сводит решение игры с интервальными параметрами к решению двух обычных игр.

Обычная антагонистическая игра с детерминированными параметрами вводится так [1]. Имеется два игрока с чистыми стратегиями М[ ,..., ит для 1-го и tx ,..., tn для 2-го игроков. Выигрыш 1-го (проигрыш 2-го) игрока при выборе ИМИ чистых стратегий соответственно Uj и tj равен а у. Все выигрыши являются детерминированными величинами и составляют платежную матрицу А = || atj ||. В более общем случае игроки используют смешанные стратегии, "смешивая" свои чистые стратегии с соот-

ветствующими вероятностями. Смешанные стратегии 1-го и 2-го игроков задаются вероятностными распределениями

т

х = (х],...,хт), Х1=Вер(и,) -, (1)

7 = 1

У = {У1.---,Уп), =]’ У] = ВеР{1])- (2)

/=1

При этом выигрыш 1-го (проигрыш 2-го) игрока оценивается математическим ожиданием величины выигрыша (платежной функцией)

т п

Ах’У) = 'ЕТаух’У1 ■ (3)

/=1,=1

Ясно, что игры с чистыми стратегиями игроков представляют собой частные случаи игры со смешанными стратегиями, соответствующие различным вырожденным вероятностным распределениям (1), (2). Решением введенной игры называется тройка {х*, у*, и}, где х*, у* - некоторые смешанные стратегии 1-го и 2-го игроков, а ю - некоторое число, обладающее свойствами

/(х*,у)>а, \/у; /{х,у*)<а, Ух. (4)

При этом х* называется оптимальной смешанной стратегией 1-го игрока, у* - оптимальной смешанной стратегией 2-го игрока, а ю - ценой игры. Доказано [1], что цена со в каждой игре единственна. Так что если некоторая игра имеет несколько различных решений, то все они имеют одно и то же значение со и различаются только значениями х* и у*. Согласно основной теореме теории игр (теорема Дж. фон Неймана), любая конечная антагонистическая игра имеет хотя бы одно решение. Данная теорема позволяет в любой игре дать каждому игроку разумные

рекомендации по выбору своей оптимальной стратегии.

Антагонистическая игра с интервальными параметрами отличается от описанной игры тем, что элементы а у платежной матрицы имеют вид замкнутых интервалов ад = , в которых

заключены все возможные значения выигрыша

1-го (проигрыша 2-го) игрока а!у Поэтому здесь платежная матрица игры оказывается интервальной матрицей вида А = Цо^ьЛ/угЦ = [А1А2] >

где А\ = ||а,у] I - нижняя детерминированная платежная матрица, а А2 =j|a//2|| ~ верхняя детерминированная платежная матрица.

Таким образом, при использовании игроками, как и в обычной игре, их смешанных стратегий (1), (2), выигрыш 1-го (проигрыш 2-го) игрока оценивается интервальной платежной функцией

_ т п

f{x>y) = Y.Y.aijxiy j ■ (5)

/=и=1

Решением нашей игры, как и выше, назовем тройку {х*, у*, со}, где х*, у* - некоторые смешанные стратегии 1-го и 2-го игроков, а 5 = [со 1,со2] - некоторый интервал, обладающую свойствами

f(x*,y)><i>, Vy; f[x,y*)< со, Vx . (6)

При этом по-прежнему х* и у* называются оптимальными смешанными стратегиями 1-го и

2-го игроков, а со - ценой игры. Согласно (6), решение игры с интервальными параметрами, если оно существует, обеспечивает игроков оптимальными смешанными стратегиями, гарантирующими им то же, что и в игре с детерминированными параметрами. Однако отыскание этого решения, как видно из (6), требует сравнения интервалов.

Сравнение интервалов по отношениям >, <

делается так [3]: для того чтобы интервалы а = [в],(22] и ^ = [^,*2] были сравнимы и в отношении а >Ь , необходимо и достаточно выполнения условия {a\>b[, aj>b2^, а для того

чтобы они были несравнимы, необходимо и достаточно выполнения хотя бы одного из двух

условий: < Ь\, а2 > *2) или (*1 < йь *2 > аг) •

Так как интервалы не всегда сравнимы, ясно, что не всякая система интервалов имеет максимальный (минимальный) интервал.

Свойства решения игры с интервальными параметрами аналогичны свойствам решения игр, имеющих детерминированные параметры: 1. Цена игры ш = [со 1, со 2] в каждой игре с интервальными параметрами, имеющей решение,

единственна. 2. Если игра с интервальными параметрами имеет решение, то цена игры 5 = [со ], ю 2 ] равна значению ее платежной функции при оптимальных смешанных стратегиях игроков со = 1{х*,у *)■ • 3. Если игра с интервальными параметрами имеет решение, то пара (х*, у*) оптимальных смешанных стратегий 1-го и 2-го игроков представляет собой седловую точку платежной функции игры, т.е.

7(х,у*)</(х*,у*)</(х*,у), \/х, Му. (7)

В (7) неравенства понимаются в интервальном смысле.

Для игры с интервальной платежной матрицей А=[А\,А2] определим две игры с детерминированными платежными матрицами: нижнюю граничную игру (ее платежная матрица есть /1,) и верхнюю граничную игру (ее платежная матрица есть Л2). Для решения |х* у* со = [сох,<02]}

указанной игры с интервальной платежной матрицей определим две границы: нижнюю

{х*, у*, сох) и верхнюю {х*, у*, со2} ■

Теорема 1 (детерминизации). Для того чтобы тройка [х*,у* со = [со х ,«>2]} была решением

игры с интервальной платежной матрицей, необходимо и достаточно, чтобы нижняя граница тройки была решением ее нижней граничной игры, а верхняя граница тройки - решением верхней граничной игры.

Теорема 1 сводит отыскание решения игры с интервальной платежной матрицей к отысканию решения двух игр с детерминированными (точно известными) платежными матрицами: нижней граничной игры и верхней граничной игры.

Теореме 1 и следующим за ней можно придать значительно более прозрачную форму, если воспользоваться понятиями согласованных игр и решений. Рассмотрим две игры с детерминированными платежными матрицами и одинаковыми числами чистых стратегий игроков. Решения этих двух игр назовем согласованными, если в них оптимальные смешанные стратегии игроков одинаковы, т.е. если они имеют вид {х*, у*, со!}, {х*, у*, <о2}, где в общем случае со, ф со2. Указанные две игры назовем согласованными, если они имеют хотя бы одну пару согласованных решений. Теорему 1 можно теперь сформулировать так.

Теорема Г (детерминизации). Для того

чтобы тройка |х* у*, ю = [со х, «и 2 ]} была решением

игры с интервальной платежной матрицей

Л = [/4],^2], необходимо и достаточно, чтобы ее

нижняя и верхняя граничные игры были согласованы, причем их согласованными решениями были

соответственно нижняя и верхняя границы этой тройки.

Представляет интерес частный случай, когда решение игры с интервальной платежной матрицей получается в чистых стратегиях.

Теорема 2. Для того чтобы тройка = ад = [0,71,0,72]} > г^е Щ - '-я чистая стратегия 1-го игрока, /,• - ]-я чистая стратегия 2-го игрока, была решением игры с интервальной платежной матрицей А = [Л[,Л2] = |0уЬс(/2]|| = Ца^-Ц,

необходимо и достаточно, чтобы тройка {иь ^ ау1} была решением ее нижней граничной игры, а тройка {иь ?у, ау2} - решением верхней граничной игры.

Теореме 2 можно придать иную форму - в терминах согласованных игр и решений.

Теорема 2'. Для того чтобы тройка \iiiJj ,<в = а у = [а,у]у 2]}, где и, - /'-я чистая стратегия 1-го игрока, ?у - ]-я чистая стратегия 2-го игрока, была решением игры с интервальной платежной матрицей А = [Л],Л2] = Ц^ь^угЦ = ||я,у||,

необходимо и достаточно, чтобы ее нижняя и верхняя граничные игры были согласованы, причем их согласованными решениями были соответственно нижняя {иь г), а,у/у! и верхняя {иь а^ границы этой тройки.

Теоремы 2, 2' можно соединить в одну теорему 2".

Теорема 2". Для того чтобы игра с интервальной платежной матрицей имела решение в чистых стратегиях, необходимо и достаточно, чтобы ее нижняя и верхняя граничные игры также имели решения в чистых стратегиях, причем они были равны соответственно нижней и верхней границам решения игры с интервальной платежной матрицей.

Теоремы 2, 2', 2" сводят отыскание решения в чистых стратегиях игры с интервальной платежной матрицей к отысканию аналогичных решений в ее нижней и верхней граничных играх.

Согласно основной теореме теории игр любая игра с детерминированной платежной матрицей имеет решение [1]. Это фундаментальное положение для игр с интервальными платежными матрицами не сохраняется.

Теорема 3. Игра с интервальной платежной матрицей имеет решение в том и только том случае, когда ее нижняя и верхняя граничные

игры имеют решения и в обоих оптимальные стратегии игроков одинаковы.

Теорему 3 можно сформулировать в более наглядной форме.

Теорема 3'. Произвольная игра с интервальной платежной матрицей имеет решение в том и только в том случае, когда ее нижняя и верхняя граничные игры являются согласованными.

Условия существования решения в чистых стратегиях для игр с интервальной платежной матрицей сформулируем отдельно.

Теорема 4. Произвольная игра с интервальной платежной матрицей имеет решение в чистых стратегиях в том и только в том случае, когда ее нижняя и верхняя граничные игры имеют решения в чистых стратегиях, причем в обоих оптимальные чистые стратегии игроков одинаковы.

Теорему 4 переформулируем более наглядно так.

Теорема 4'. Игра с интервальной платежной матрицей имеет решение в чистых стратегиях только тогда, когда ее нижняя и верхняя граничные игры имеют согласованные решения в чистых стратегиях.

Из теорем 3, 3', 4, 4', учитывая, что нижняя и верхняя граничные игры каждой игры в общем случае независимы и потому не обязательно согласованы, можно заключить, что игры с интервальными платежными матрицами не всегда имеют решение. Отсутствие решения игры в общем случае есть плата за недостаток информации о платежной матрице, задаваемой лишь с точностью до интервалов возможных значений.

Теория антагонистических игр была задумана для формирования рекомендаций сторонам конфликта [1]. Теорема Дж. фон Неймана гарантировала возможность таких рекомендаций при полной информации о выигрышах сторон. Полученные результаты показывают, что при неполной информации такие рекомендации не всегда возможны.

ЛИТЕРАТУРА

1. Нейман Дж. фон, Моргенштерн О. Теория игр и экономическое поведение. М.: Наука, 1970. 708 с.

2. Алефельд Г., Херцбергер Ю. Введение в интервальные вычисления. М.: Мир, 1987. 358 с.

3. Левин В.И. Дискретная оптимизация в условиях интервальной неопределенности // Автоматика и телемеханика. 1992. № 7. С. 97-106.

4. Левин В.И. Недетерминистская бесконечнозначная логика и ее применение // Логическое управление с использованием ЭВМ: Тез. докл. ХП Всесоюз. симпоз. М., 1989. С. 20-26.

Поступила в редакцию 2 июля 1997 г.

i Надоели баннеры? Вы всегда можете отключить рекламу.