Научная статья на тему 'Нахождение представителя класса нечетких ситуаций при построении модели принятия решений'

Нахождение представителя класса нечетких ситуаций при построении модели принятия решений Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
110
24
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
представитель / класс / нечеткие множества / Ситуация / выбор / Решение / сходство / признак / управление

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Карелин Владимир Петрович, Кузьменко Оксана Леонидовна

Рассмотрены способы определения степени близости или расстояния между нечеткими описаниями ситуаций в классификационных моделях принятия решений. Предложен способ сравнения ситуаций и нахождения представителя для заданного класса, основанный на сравнении репрезентативных чисел нечетких множеств, входящих в описание сравниваемых ситуаций. В качестве такого репрезентативного числа используется результат агрегирования номеров термов (лингвистических значений) соответствующей лингвистической переменной, входящей в описание ситуации.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Карелин Владимир Петрович, Кузьменко Оксана Леонидовна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

In this paper the methods for fuzzy situations description similarity or distance determination in classification models of decision making is considered. The approach for comparison of fuzzy situations is offered and it is shown how to calculate the representative situation within a specified subset (class) of situations. This approach is based on comparison of fuzzy sets representative numbers (indexes). As a basis for such representative number the result of aggregation of the indexes of a set of labels assessed in a linguistic term set is used.

Текст научной работы на тему «Нахождение представителя класса нечетких ситуаций при построении модели принятия решений»

УДК 681.5: 519.81

НАХОЖДЕНИЕ ПРЕДСТАВИТЕЛЯ КЛАССА НЕЧЕТКИХ СИТУАЦИЙ ПРИ ПОСТРОЕНИИ МОДЕЛИ ПРИНЯТИЯ РЕШЕНИЙ

© 2008 г. В.П. Карелин, О.Л. Кузьменко

Рассмотрены способы определения степени близости или расстояния между нечеткими описаниями ситуаций в классификационных моделях принятия решений. Предложен способ сравнения ситуаций и нахождения представителя для заданного класса, основанный на сравнении репрезентативных чисел нечетких множеств, входящих в описание сравниваемых ситуаций. В качестве такого репрезентативного числа используется результат агрегирования номеров термов (лингвистических значений) соответствующей лингвистической переменной, входящей в описание ситуации.

In this paper the methods for fuzzy situations description similarity or distance determination in classification models of decision making is considered. The approach for comparison of fuzzy situations is offered and it is shown how to calculate the representative situation within a specified subset (class) of situations. This approach is based on comparison of fuzzy sets representative numbers (indexes). As a basis for such representative number the result of aggregation of the indexes of a set of labels assessed in a linguistic term set is used.

Ключевые слова: представитель, класс, нечеткие множества, ситуация, выбор, решение, сходство, признак, управление.

Предельно возросшие в последние десятилетия уровень конкуренции и нестабильность внешнего мира требуют использования иных принципов и подходов к формированию и принятию управленческих решений при управлении социотехническими системами в отличие от традиционного управления чисто техническими объектами.

В связи с этим важной задачей становится создание адаптивных быстро реагирующих управленческих механизмов, позволяющих принимать решение в условиях нечеткости исходной информации. К классу социотехнических систем относятся социально-экономические системы, промышленные, транспортные, системы связи, здравоохранения и т.п. Управление такими системами требует не только большого опыта, знаний, квалификации, но и использования современных информационных технологий и соответствующих интеллектуальных систем поддержки принятия решений.

Такие системы, обрабатывая и анализируя имеющуюся информацию о состояниях объекта управления и о внешней среде, предлагают лицу, принимающему решения, несколько альтернативных вариантов решений (действий). Право выбора конкретного решения остается за человеком.

Для управления сложным объектом необходимо иметь либо достаточно точную, но весьма сложную математическую модель объекта управления, либо модель управления объектом, что более целесообраз-

но. Иначе говоря, имеет смысл моделировать не сам объект, а действия человека-оператора в процессе управления объектом.

Подобные модели, использующие не только традиционные, четкие алгоритмы и количественные данные, но и нечеткие алгоритмы и качественные оценки, реализуют в виде нечетких систем управления, включающих интеллектуальные системы поддержки принятия решений [1-3]. Основными структурными компонентами этих систем являются база знаний, база моделей, база данных, блок логического вывода -интеллектуальный решатель, блок лингвистического представления ситуаций, блок числового представления ситуаций.

Наиболее характерным механизмом логического вывода является механизм, основанный на продукционных правилах. Вывод на основе нечетких правил-продукций является обобщением традиционного дедуктивного вывода (правило modus ponens).

Для представления и обработки знаний наряду с продукционными моделями часто используются ситуационные модели, где ограниченный набор нечетких ситуаций может описывать практически бесконечное число состояний объекта управления [1]. Логический вывод ситуационного типа основан на сравнении описаний ситуаций. Такой вывод, базирующийся скорее на аналогиях (прецедентах), чем на правилах, применяется в классификационных моделях принятия решений (ПР).

Классификационные модели ПР основаны либо на вычислении для данной конкретной ситуации ее степени принадлежности каждому из эталонных классов, либо на вычислении сходства описания текущей ситуации с каждой из эталонных ситуаций (ЭС) с последующим выбором решения, соответствующего тому классу или той ЭС, которой данная ситуация принадлежит с наибольшей степенью. Такие модели ПР описывают разбиение многомерного пространства признаков - факторов, наиболее существенно влияющих на выбор управляющих решений, на нечеткие области (эталонные классы), соответствующие этим решениям

[4].

Ситуацией называется набор значений признаков, описывающих состояние объекта управления в некоторый момент времени. Очевидно, от ситуации зависит и выбор управленческого решения. Под нечетким описанием ситуации понимается такое, где отображены не только количественные, но и ряд качественных характеристик системы. Например, для рентабельности предприятия различают качественные уровни: «очень низкий», «низкий», «средний», «высокий». Вид нечеткого описания ситуаций существенно зависит от области приложения. В ряде случаев нечеткое описание представляет собой совокупность нечетких множеств первого уровня, например: = {качество среднее, производительность низкая, себестоимость высокая и т.д.}. В еще более неопределенных обстоятельствах ПР описание ситуации представляется совокупностью нечетких множеств второго уровня

[5]. Примером такого описания ситуации, характеризующей некоторое состояние, возникшее при управлением предприятием, является следующий: 5 = = {(<0,4/«низкое»>, <0,8/«среднее»>, <0,2/«высокое»> > «качество»), (<0,1/«очень низкая»>, <0,4/«низкая»>, <0,8/«средняя»>, <0,6/«высокая»>, «производительность»), (<0,1/«низкая»>, <0,6/«средняя»>, <0,9/«высокая»>, «себестоимость»>)}.

Здесь каждому признаку (качество, производительность, себестоимость) соответствует лингвистическая переменная, значения которой (низкая, средняя, высокая и т.п.) в описании ситуации также заданы нечетко.

При разработке моделей, имитирующих процессы ПР человеком-оператором, будем исходить из того, что человек представляет собой нечеткую систему классификации и распознавания образов, соответствующих возможным управлениям в системе, а ПР есть процесс распознавания ситуаций в многомерном пространстве признаков. Это предположение при условии существования эффективных процедур формирования эталонных классов ситуаций (ЭКС), дает возможность строить эффективные схемы ПР.

Процесс построения и использования классификационных моделей ПР включает в себя следующие основные элементы:

1) построение функций принадлежности для значений каждого признака, описывающего ситуацию. От того, насколько адекватно функция принадлежности отражает знания экспертов, зависит качество принимаемых решений. Процедуры построения функций принадлежности рассмотрены в работах [1, 4-6];

2) нечеткое описание типовых ситуаций и текущей ситуации;

3) построение гомоморфных отображений полученных качественных оценок и отношений на числовую систему, позволяющих подвергать качественные суждения строгому количественному анализу;

4) структурирование информации на основе агрегирования (обобщения, классификации, кластеризации) полученных данных - формирование ЭКС;

5) построение (или отыскание) для каждого из сформированных ЭКС наилучшего представителя -эталона класса, т.е. ЭС;

6) выбор лучших решений на основе нечеткого распознавания принадлежности текущей ситуации к тому или иному ЭКС.

Для формирования ЭКС применяются методы нечеткой классификации. Наличие ЭКС с известными заранее решениями позволяет ускорить поиск управленческого решения и для конкретной текущей ситуации 50, сложившейся на объекте управления. Это достигается путем нахождения (или формирования) для каждого ЭКС представителя данного класса - эталонной ситуации. Набор 55 таких ЭС характеризует все возможные состояния объекта управления. Решение, которое предлагается принимать при конкретной сложившейся на объекте ситуации 50, определяется ситуацией Я; из набора 55 наиболее близкой ситуации 50. Поскольку каждая ситуация описывается совокупностью нечетких множеств, то при определении близости (степени сходства или несходства) ситуаций можно использовать те же формулы, по которым сравниваются нечеткие множества.

Пусть на базовом множестве X = {хь х2, ..., хя} заданы нечеткие множества: А ={цА(х)/х} и В ={цВ(х)/х}, где хеХ, Ца(х), Цв(х) е [0, 1].

Для определения степени сходства (несходства) нечетких множеств А и В применяют различные меры близости и расстояний, в частности меры сходства Дейка, Танимото, расстояние Хэмминга и др. [4].

В данной работе предлагается на всех этапах построения и применения классификационных моделей ПР оперировать не значениями дискретных функций принадлежности сравниваемых нечетких множеств, а их репрезентативными числами. В качестве репрезентативного числа гА, характеризующего данное нечеткое множество А , будем использовать значение центра масс (тяжести) его функции принадлежности, которое определяется по формуле

E^ a (xi)X

^А = ^

(1)

ЕЦ Л (хг )

г=1

Для разбиения множества из N ситуаций, которым соответствуют одинаковые управленческие решения, на подклассы (кластеризация по сходству описаний) необходимо определить степень сходства (или расстояние) для каждой пары ситуаций из заданного множества. Поскольку число таких пар равно то, обозначив трудоемкость процедуры определения сходства двух нечетких множеств через Тс, получим следующую оценку трудоемкости для всех пар ситуаций: Т N к) = ^(^-Л0Тс/2, где k - количество признаков (нечетких множеств) в описании ситуаций.

Трудоемкость Тс процедуры определения степени сходства двух нечетких множеств А и В, каждое из которых задано набором из п значений функции принадлежности, зависит от вида используемой меры сходства С(А, В).

Например, при использовании формулы Дейка,

где

П

И| 2Е А (Хг X Ц В (Хг ))

Сд(А, В) = 2|А П В| - г'=1

I A | +1 B |

Eh- a (x) + E^ в(x)

трудоемкость Тс = О(п).

Трудоемкость Td процедуры определения расстояния между нечеткими множествами А и В по формуле d(А, В) = гА - гВ, включающая трудоемкость вычисления значений гА и гВ, равна О(п2), т.е. T¿ = пТс. Так как в большинстве случаев выполняется 5 < п <11, то трудоемкость процедуры определения степеней сходства между N ситуациями попарно примерно на порядок меньше, чем при определении расстояний между ними с использованием репрезентативных чисел г1.

Построив отношения сходства (или несходства) между N ситуациями заданного класса, можно выполнить процедуру кластеризации, трудоемкость которой уже не зависит от способа определения близости ситуаций. В результате кластеризации множество ситуаций с одинаковыми решениями разобьется на классы эквивалентности, т.е. ЭКС, включающие близкие по описанию ситуации. Таким образом, если исходное число классов ситуаций соответствовало числу различных управленческих решений, то после выполнения кластеризации количество ЭКС может значительно превышать количество решений.

Разбиение множества ситуаций на подмножества (ЭКС) целесообразно выполнять лишь при большом количестве несхожих ситуаций в данном классе. Однако следует отметить, что в большинстве случаев ситуации, объединенные изначально в классы по сходству управленческих решений, являются достаточно схожими и по значениям признаков. Тогда такой исходный класс ситуаций считается эталонным.

Одной из наиболее важных задач, которую необходимо решать при построении классификационных моделей ПР, является нахождение представителя (ЭС) для каждого ЭКС.

Традиционным способом ее решения является предварительное вычисление степени сходства или расстояния между ситуациями ЭКС. После чего в качестве представителя выбирается та из ситуаций данного класса (медиана Кемени), сумма расстояний, от которой до всех ситуаций данного класса минимальна (либо сумма степеней сходства которой со всеми остальными ситуациями данного класса максимальна). Как показано выше, вычисление значений сходств (или расстояний) при большом количестве N ситуаций в ЭКС - процедура весьма трудоемкая, с оценкой О(Ы1).

Оценка трудоемкости выбора представителя для класса из N ситуаций, каждая из которых описывается к признаками - лингвистическими переменными (ЛП), следующая: Т^к) = к Ы1Тс.

Нами предлагается другой, значительно менее трудоемкий способ нахождения представителя класса из N нечетких ситуаций, который заключается в формировании для данного класса некой усредненной ситуации. Поскольку любая ситуация задана нечеткими значениями каждой из к ЛП (нечеткими множествами второго уровня), то для построения усредненной ситуации необходимо для каждого нечеткого множества рассчитать репрезентативное число г (выполнить переход от нечеткого представления к четкому). В результате каждая из N ситуаций будет представлена репрезентативным вектором (РВ) R = (гь г2,... гк), состоящим из к репрезентативных чисел. Усредненная ситуация также будет представлена аналогичным репрезентативным вектором Rср, каждый элемент гг (г = 1, 2, ..., к) которого получен как среднее арифметическое соответствующих 1-х элементов всех N векторов R.

Для предложенного способа оценка трудоемкости формирования РВ в качестве представителя для ЭКС из N ситуаций следующая: Т2(Ы,к) = ШТГ, где Тг -трудоемкость процедуры определения репрезентативного числа г нечеткого множества второго уровня. Учитывая, что Тг = (п/2)Тс, видим, что трудоемкость Т2(^ к) в 2N/п раз меньше, чем Т^, к).

Если в качестве ЭС необходимо выбрать медиану Кемени, то нужно определять расстояния от Rср до РВ каждой из N ситуаций данного ЭКС (хэммингово расстояние), и в качестве медианы, т.е. ЭС, взять ту нечеткую ситуацию, до которой это расстояние минимально. Это потребует выполнения еще порядка Ш простых операций.

Предложенный способ представления ситуации посредством РВ выгодно использовать (с точки зрения трудоемкости вычислений) и при сравнении текущей ситуации с ЭС. Для этого необходимо получить РВ для текущей ситуации (для каждой из ЭС соответствующие РВ получены заранее). Расстояние D между текущей ситуацией 50 и ЭС Sj определяется по формуле Хэмминга:

1=1

1=1

D(S0, Sj) = £ | r? - r/l

i=1

(2)

Ближайшей к текущей ситуации 50 считаем ту из ЭС Sj, до которой расстояние D(S0, 5)) меньше, чем для остальных ЭС.

Рассмотрим предложенный способ нахождения представителя класса нечетких ситуаций на конкретном примере.

Пусть X = {хь х2, х3, х4} - множество признаков, значениями которых описывается состояние предприятия, где XI - производственная устойчивость (ПУ), х2 - управленческая устойчивость (УУ), х3 -финансовая устойчивость (ФУ), х4 - деловая устойчивость (ДУ). Каждый признак (вид устойчивости) х, описывается соответствующей ЛП, множество значений ti (термов) которой обозначим через Т. Значение каждой ЛП в описании ситуации задается нечетким множеством второго уровня G = {<цо(1,)/1,>}, где базовым множеством является терм-множество Т. В общем случае терм-множества для различных ЛП также различаются.

В нашем примере терм-множества значений каждого из признаков (ЛП), в силу их однотипности, примем одинаковыми: Т = {10 - несущественный уровень; ^ - очень низкий; 12 - низкий; 13 - средний; 14 - высокий; 15 - очень высокий; 4 - значительный уровень}. Приведенные лингвистические значения ti ЛП, в свою очередь, задаются нечеткими множествами первого уровня, функции принадлежности которых будем представлять нечеткими треугольными функциями или, иначе, нечеткими треугольными числами, определенными на базовом множестве и = {0; 0,17; 0,33; 0,5; 0,67; 0,83; 1}. Нечеткие треугольные или трапециевидные числа являются частным случаем функций принадлежности типа ^-Я), которые широко используются для описания экспертных суждений [5-7].

Зададим некоторое значение ЛП (признака) «производственная устойчивость - ПУ» следующим нечетким множеством: {< 0/несущественный уровень >,

< 0/очень низкий >, < 0/низкий >, < 0/средний >,

< 0,7/высокий >, < 0,7/очень высокий >, < 0/значитель-ный >}. Для компактности описания ситуаций заменим в нечетких множествах все названия термов (низкий, средний уровень и т.д.) их обозначениями и (1 = 0, 1, ..., 6) в терм-множестве Т.

Пусть задан ЭКС с известным управленческим решением, включающий следующие три нечетко описанные ситуации:

^ = {(<0/10>, <0/^>, <0/12>, <0/13>, <0,7/14>, <0,7/15>, <0/16> «ПУ»), (<0//^, <0/t1>, <0/t2>, <0/t3>, <0,7/t4>, <0,7/t5>, <0/t6> «УУ»), (<0//0>, <0/^> <0,3/t2>, <1/t3>, <0,3/t4>, <0/t5>, 0/t6> «ФУ»), (<0//0>, <0/t1>, <0/t2>, <0/13 >, <1/t4>, <0/t5>, <0/t6> «ДУ»)};

52 = {(<0//о>, <0/t1>, <0/12>, <0/t3>, <0/t4>, <0,3//5>, <1/t6> «ПУ»), (<0//0>, <0,7/t1>,<0,7/t2>, <0/t3>, <0/t4>, <0/15>, <0/t6> «УУ»), (<0//^, <0/t1>, <0,3/12>, <1/t3>, <0,3/t4>, <0/t5>, <0/t6> «ФУ»), (<0//0>, <0/t1>, <0/t2>, <1/tз>, <0^4>, <0/t5>, <0/t6> «ДУ»)};

53 = {(<0//о>, <0/t1>, <0,3/t2>, <1/t3>, <0,3/14>, <0/t5>, <0/t6> «ПУ»), (<0//^, <0М>, <0/t2>, <0/t3>, <0/t4>, <0,3/t5>, <1/4> «УУ»), (<0//0>, <0/t1>, <0/t2>, <0/13>, <0,7/t4>, <0,7/t5>, <0/t6> «ФУ»), (<0//0>, <0/t1>, <0/t2>, <0/t3>, <1/t4>, <0/15>, <0/t6> «ДУ»)}.

Покажем, как для этого ЭКС найти представитель класса и в виде некоторой усредненной ситуации (РВ = _КФ), и в виде медианы Кемени.

Поскольку в нечетких множествах второго уровня элементами базового множества являются словесные (лингвистические) строго упорядоченные (по индексам 1) значения 1,, то в формуле (1) для получения репрезентативного числа г такого нечеткого множества в качестве значения базовой переменной ti правомерно использовать ее порядковый номер - индекс i. Тем самым формула (1) примет вид:

6

Ем- о )1

„_ 1=0

£ Ц G (ti )

i=0

Для отыскания РВ каждой ситуации вычислим значения репрезентативных чисел г, (1 = 1, 2, 3) для каждого признака. Затем найдем среднее арифметическое значение г, по каждому из признаков. Полученные значения представлены в табл. 1.

Таблица 1

Значения элементов репрезентативных векторов

ri Ri(Si) R2S) R3(S3) Rcp={rA

Г1 (ПУ) 4,5 5,8 3,0 4,4

Г2 (УУ) 4,5 1,5 5,8 3,9

r3 (ФУ) 3,0 3,0 4,5 3,5

Г4 (ДУ) 4,0 3,0 4,0 3,7

Набор ri средних арифметических значений ri по каждому признаку дает РВ = Яср, соответствующий новой усредненной ситуации, являющейся представителем класса из заданных трех ситуаций.

В ряде случаев желательно по РВ восстановить нечеткое описание ситуации. Для этого можно воспользоваться функцией 8(г ), приведенной в [7]:

5(г*) = {(1,; 1-у), (4+ь у)},

где к = й"ипк(г*) - номер терма ЛП, Ь-ыпЩ - операция выделения целого числа; у = г - к.

К примеру, возьмем г1 = 4,4. Получим: к = = 1птЩ,4) = 4; у = 4,4 - 4 = 0,4; 5(4,4) = {(14; 0,6), (15; 0,4)}.

Подсчитав аналогичным образом кортежи Ъ(ri) для каждого значения г, из Rсp, легко построить соответствующую усредненную ситуацию , выступающую в качестве представителя заданной ЭКС. Ее нечеткое описание имеет вид:

5* = {(<0Ло>, <0М>, <0Л2>, <0Л3>, <0,6Л4>, <0,4/t5>, <0/t6> «ПУ»), (<0/t0>, <0Л1>,<0Л2>, <0,l/t3>, <0,9/t4>, <0/t5>, <0/t6> «УУ»), (<0/t0>, <0/t1>, <0/t2>, <0,5//3>, <0,5Л4>, <0/t5>, <0/t6> «ФУ»), (<0/t0>, <0/t1>, <0/t2>, <0,3/t3>, <0,7/t4>, <0/t5>, <0/4> «ДУ»)}.

Для выбора в качестве представителя (ЭС) среди ситуаций заданного ЭКС медианы Кемени найдем по формуле (2) хэммингово расстояние между Rсp и Rj (/ = 1, 2, 3). Полученные результаты представлены в табл. 2.

Таблица 2 Значения хэмминговых расстояний

|Щср - Щ йРсрЩ0 й?(ЩсрЩ2) ^(ЩсрЩз)

|r1* - r1 0,1 1,4 1,4

|Г2* - Г2| 0,6 2,4 1,9

Гз* - Гз1 0,5 0,5 1,0

|Г4* - Г4| 0,3 0,7 0,3

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

D(S*, S,) 1,5 5,0 4,6

Медианой Кемени будет являться нечеткая ситуация 51, для которой значение D(5, 51) хэммингова расстояния минимально.

Предложенные в работе методы формирования эталонного представителя класса нечетких ситуаций и распознавания текущей ситуации позволяют строить классификационные модели принятия управленческих

решений, способные оперировать качественной информацией, полученной от экспертов, и находить лучшее решение в конкретной сложившейся ситуации. Разработка и применение классификационных моделей и методов ПР актуальны не только для решения задач управления сложными технологическими объектами в условиях нечеткости и многокритериально-сти, но также и при создании систем планирования, структурного проектирования, прогнозирования, экологического мониторинга и т.п.

Литература

1. Мелихов А.Н., Берштейн Л.С., Коровин С.Я. Ситуацион-

ные советующие системы с нечеткой логикой. М., 1990.

2. Леденева Т.М., Татаркин Д.С. Особенности проектирования систем нечеткого логического вывода // Информационные технологии. 2007, № 7. С. 12-18.

3. Карелин В.П., Кузьменко О.Л. Средства и методы поддержки принятия управленческих решений в условиях нечеткости, неопределенности и многокритериальности // Вестн. Таганрогского ин-та управления и экономики. 2007. № 1(5). С. 73-77.

4. Берштейн Л.С., Карелин В.П., Целых А.Н. Модели и методы принятия решений в интегрированных интеллектуальных системах. Ростов н/Д., 1999.

5. Заде Л.А. Понятие лингвистической переменной и его применение к принятию приближенных решений. М., 1976.

6. Рыжов А.П. Элементы теории нечетких множеств и ее

приложений. М., 1998.

7. Herrera F., Martinez L. A Fusion Method for Multi-Granularity Linguistic Information based on the 2-tuple Fuzzy Linguistic Representation Model. Technical Report #DECSAI-99107. March, 1999. P. 44-64.

29 января 2008 г.

Карелин Владимир Петрович - д-р техн. наук, профессор, заведующий кафедрой Таганрогского института управления и экономики. Тел. 36-25-83, доб. 1-14. E-mail: [email protected].

Кузьменко Оксана Леонидовна - аспирант Таганрогского института управления и экономики. Тел. 36-25-83, доб. 1-14. E-mail: [email protected].

i Надоели баннеры? Вы всегда можете отключить рекламу.