УДК 004.832
Д.В. Пинчер, В.Л. Токарев
Оценивание стратегии противодействующей стороны
Предлагается решение задачи оценивания стратегии противодействующей стороны в задаче принятия решения на основе использования лингвистической модели. Ключевые слова: оценивание стратегии, моделирование, лингвистическая модель, обучение, принятие решений.
Введение
В настоящее время в таких отраслях, как экономика, информационная безопасность и им подобных, требуется выполнять наиболее рациональные и эффективные действия в условиях противодействия. Одним из условий эффективного решения данной задачи является умение оценивать стратегию противодействующей стороны.
Под стратегией понимается способ использования средств и ресурсов, направленный на достижение цели субъекта, реализуемый посредством комплекса действий (ходов), обычно предпочитаемого субъектом для решения различных задач его жизнедеятельности [1]. На важность решения такой задачи указывалось в трудах [2-4]. Постановка задачи
Задачу оценивания стратегии противодействующей стороны (ПС) можно рассмотреть с позиций теории игр. Тогда в задачах поддержки принятия решений под стратегией будем понимать траекторию достижения цели - выбранная субъектом последовательность изменяющихся состояний (стк е Е,к = 0,1,...,п} игры. Здесь Сто - исходное состояние; ст„ - её конечное состояние; к - дискретное время, которое синхронизировано с очередными ходами ЛПР ПС
Хк и Хк субъектов - участников игры: лица, принимающего решение (ЛПР), с одной стороны, и противодействующей стороны (ПС) - с другой, и поэтому оно отличается
от равномерного дискретного времени. Целью игры для ЛПР является желаемое состоя-
ЛПР ПС
ние стп , а для ПС - желаемое состояние стп . То есть стратегия ПС - это
таПС ={о,..., ПС| е , где - конечное множество возможных стратегий достижения цели g с небольшой мощностью.
Каждый очередной ход хй+1 является результатом принятия решения субъектом на основе анализа имеющейся в его распоряжении информации
хк+1 = ¥ Х ,СТк,^), i * /, и / е(ЛПР,ПС} , (1)
где ¥1 (•) - некоторое правило принятия решения, а ^ - выбранная стратегия i-м субъектом. Причем доступной для непосредственного наблюдения i-м субъектом является только информация , заключающаяся в наборе значений ^хк_1,х^_1,ст^ .
В свою очередь, каждое состояние стй является результатом очередной пары ходов
(хк_1,х1 ^ст|, стк е Е , (2)
где Е - конечное множество состояний игры.
Поэтому задача выбора хода для любой из сторон является задачей принятия реше-
ПС
ний в условиях неопределенности (например, для ЛПР не известна стратегия так , так же (по предположению) как и для ПС не известна таЛПР , если ЛПР сам не раскрыл её каким-либо образом).
Из выражения (1) следует, что для обеспечения должной эффективности поддержки принятия решения относительно очередного хода ^о субъекта необходима процедура, позволяющая получить оценку стратегии /-го субъекта. Задачу получения такой оценки можно сформулировать следующим образом:
так = а^ттр(х|(та3 ),х|(та3)), (3)
К у 7
264 УПРАВЛЕНИЕ, ВЫЧИСЛИТЕЛЬНАЯ ТЕХНИКА И ИНФОРМАТИКА
где Wz =|хт ,хт ,ат ,т = к - 1,к - 2,...,к - N - выборка данных, собранная в течение некоторого времени, в которых зафиксированы ходы двух сторон х1т,х]т и полученные в результате этих ходов состояния; р(-) - это некоторая метрика, которая позволяет сравнивать различные решения х1р е Xк , Хк - допустимое конечное множество решений для данного состояния игры ст^; хк (та- решение, полученное на основе имеющейся информации 1к и полученной оценки та£ , а хк (та-1) - решение, полученное на основе той же информации и точном знании стратегии так , полученном каким-то путем, например
в результате разведывательных действии.
Таким образом, предполагая, что известными для i-го субъекта являются: 1) цель j-го субъекта g= стП ; 2) выборка данных Wk ; 3) исходное состояние CTq, требуется получить оценку так е S, отвечающую требованию (3), считая множество S также известным.
Предполагается также, что выбранная j-м субъектом стратегия в ходе текущей «игры» не меняется.
Сформулированная в таком виде задача является задачей классификации, решить которую предлагается следующим образом.
На первом этапе по имеющейся выборке Wk строится модель процесса (1). На втором - из множества S выделяется подмножество
S' = |таj = Ff1 {xjm,xlm,стт)|, m = k - 1,k -2,...,k -1, t << N, (4)
для которого справедливо |S'|<|S . Выполняется тем самым грубая классификация. На третьем этапе из множества S' с помощью «тонкого» классификатора выбирается одна оценка та-' , наилучшим образом отвечающая требованию (3).
Примечание. При сравнительно небольшой мощности S для получения оценки (3)
может оказаться достаточным выполнения только первого этапа. Решение задачи
Классификаторы (и грубый, и тонкий) предлагается строить в виде двухуровневой лингвистической модели, которая позволяет получить закономерность вида (1) в среде разнотипных данных [5].
Общий вид такой модели может быть представлен как нечёткое отношение LIN: 3(Xm ) ^3(Yn ), или LIN : Xm ^ Yn, описываемое выражением
k
LIN = u (au n a2i n... n m ) ^ (Ьц n b2,i n... n b^i ),
i=1
где 3(Xm ),3^Yn j - множества нечётких подмножеств, определённых на базовых множествах Xm={x1,...,x2,...,xm}, Yn={y1,...,y2,...,yn}; е A-, j=1,..., m; i=1,..., k; k - число правил; A- - множество значений входных лингвистических переменных, определённых на множествах Х- ç Xm , Ьц е Bi, l = 1,..., n; i = 1,..., k; Bi - множество значений выходных
лингвистических переменных, определённых на множествах Y £ Yn , Am = x A-,Bn = x Bi.
jeJ 1 leL
Значениям лингвистических переменных ai,- e A- соответствуют нечёткие множества
с функцией принадлежности (Х-) , а значениям лингвистических переменных
bi i e Bi - нечёткие подмножества с функцией принадлежности ц^ (Yi ) .
При построении такой модели должны быть решены следующие задачи: 1) построение двухуровневой структуры LIN, выбирая переменные для грубой и тонкой части модели; 2) разбиение по признаку вариативности выборки данных Wk на две подвыборки: обу-
L с
чающую Wk (с большей вариативностью) и контрольную Wk ; 3) составление первого приближения LIN(1) с помощью информационной меры, используя подвыборку Wk ;
с
4) настройка модели с помощью тестового критерия, используя подвыборку Wk ;
5) оценка адекватности полученной LIN(2) по новым наблюдениям [5].
Если адекватность модели окажется достаточной, определяется подмножество Н' методом инвертирования модели, используя грубую (нижнюю) часть LIN(2), затем отыскивается путь в графе, отображающем тонкую (верхнюю) часть LIN(2), наилучшим образом, соответствующей значениям переменных тонкой части. Найденный путь в графе, отображающем LIN(2), и будет искомой оценкой стратегии ПС, отвечающей требованию (3). Это непосредственно следует из теоремы, доказанной в [5].
Пример использования предлагаемого метода
Описанный метод исследовался на примере решения задачи оценивания стратегии конкурента на рынке бытовой техники. Предположим, нам известна цель конкурента -захват этого рынка в некотором населённом пункте. Также нам известны выполненные им действия: увеличение количества рекламы стиральных машин, снижение цен на эту группу товаров и проведение лотерей для всех покупателей.
Грубый классификатор при решении задачи описанным методом предлагает два возможных варианта - ликвидация старых нераспроданных моделей стиральных машин и привлечение новых покупателей. Тонкий классификатор из указанного множества вариантов позволяет выбрать второй - определяющим фактором служит то, что конкурент проводит лотереи для покупателей всех видов техники, а не только стиральных машин.
Таким образом, стратегия ПС была полностью раскрыта с применением вычислительного аппарата ЭВМ при минимальных затратах.
Заключение
В статье описан метод оценивания стратегии противодействующей стороны, который может быть использован для компьютерной поддержки принятия решений задач, которые могут быть сведены к игре двух лиц с нулевой суммой, и приведён пример его использования с обоснованием эффективности. Данный метод, основанный на теории игр, предоставляет возможность математического описания алгоритма действий ПС в виде пути от исходного состояния системы к желаемому состоянию ПС. Это позволило формализовать задачу, выполнить её математический анализ и синтезировать решение на основе одного из алгоритмов поиска кратчайшего пути в графе.
Литература
1. Грейсон Д. Американский менеджмент на пороге XXI века / Д. Грейсон, К. О'Делл. - М.: Экономика, 1991. - 319 с.
2. Трахтенгерц Э.А. Компьютерная поддержка формирования целей и стратегий. -М.: СИНТЕГ, 2005. - 224 с.
3. Малинецкий Г.Г. Сценарии, стратегии, информационные технологии // Информационные и вычислительные системы. - 2003. - № 4. - С. 83-108.
4. Pearce J.A. Formulation, Implementation and Control of Completive Strategy / J.A. Pearce, R.B. Robinson. - 11th edition. - Chicago: IL, Richard D. Irwin, Inc., 2009. -500 p.
5. Токарев В.Л. Компьютерная поддержка принятия решений. - М.: Изд-во СГУ, 2000. - 120 с.
Пинчер Денис Владимирович
Аспирант Тульского государственного университета
Тел.: 8-920-747-67-37
Эл. почта: [email protected]
Токарев Вячеслав Леонидович
д-р техн. наук, проф. Тульского государственного университета
Тел.: 8 (487-2) 33-24-10
Эл. почта: [email protected]
Pincher D.V., Tokarev V.L. The opponent strategy estimation
A solution for the opponent strategy estimation in the making decision problem, which is based on the use of the linguistic models, is suggested.
Keywords: strategy estimation, modelling, linguistic model, systems teaching, decision making.