УДК 681.3.06:519.711.3 ББК 32.973.-018 С 37
В.С. Симанков, А.В. Шопин
Ситуационный логический вывод на основе нечеткой кластеризации состояний
(Рецензирована)
Аннотация:
В статье рассматривается частный случай проблемы управления сложным объектом в условиях нечеткой исходной информации. Вводится понятие нечеткой ситуации. Предлагается метод автоматической классификации состояний сложного объекта на основе алгоритма кластеризации нечетких с-средних и алгоритм ситуационного логического вывода для управления сложным объектом в условиях нечеткой исходной информации.
Ключевые слова:
Управление, сложный объект управления, классификация состояний, нечеткий кластер-анализ, ситуационный логический вывод.
Одной из отличительных характеристик сложных объектов (СО) является наличие большого количества независимых входных и выходных параметров, характеризующих состояние системы неоднозначным образом. Построение адекватной модели при большом количестве входных переменных требует большого объема базы знаний, количество продукционных правил в которой экспоненциально возрастает с увеличением входов модели, что снижает качество нечеткого логического вывода.
В этом случае на этапе генерации базы знаний, состоящей из нечетких логических правил, целесообразно оперировать не конкретными параметрами системы, а классами ее состояний. Это, в большинстве случаев приводит к уменьшению объема базы знаний, и соответственно к повышению точности управления.
Следовательно управление СО должно осуществляться не по его параметрам, а по состояниям [1]. Таким образом, в САУ СО возникает задача идентификации состояния сложного объекта управления по его наблюдаемым (известным) параметрам.
Нечеткие ситуации. Пусть У={у1, у2, ■■■, уР} множество признаков, значениями которых описывается состояние объекта управления, окружающей среды и системы управления. Каждый признак уг (г е1 = {1, р}) описыва-
ется соответствующей лингвистической пере-
менной < у, Т, Бг >, где Тг - { , {2 ’"^'т } ~ терм-множество ЛП уг (набор лингвистических значений признака), тг - число значений признака; Бг - базовое множество признака уг. Для
описания термов Т’ (г е Ь = {1, 2, ..., т} соответствующих значениям признака уг, используются нечеткие переменные < Т, Бг, 0^ >,
j - описывается нечетким множеством 0 в базовом множестве Д.
0 -1< Мсг (ё) / ё >| ё е (1)
Тогда нечеткой ситуацией £ называется [2] нечеткое множество второго уровня
* -{М* (Уг)/ Уг >у Уге У, где (2)
М*(Уг)-{<^№Т)/т' >У Т е Т,
где У = {у1, у2, ..., уР} множество признаков, характеризующих состояние системы, и каждому признаку уг е У поставлена в соответствие лингвистическая переменная < уг, Тг, Бг >,
где т-{, т2г,..., тт у - терм-множество ЛП уг, Бг - предметная шкала.
Нечеткими ситуациями задаются состояния, в которых находятся объект управления, окружающая среда и система управления.
Классификация состояний. Пусть состояние объекта или предметной области можно охарактеризовать значениями некоторых признаков или параметров. Если множество состояний объекта обладает общими свойствами, или значениями признаков описания состояний, говорят о наличии класса состояний объекта.
Под процедурой формирования классов, классификацией, понимают упорядочение состояний объекта по их схожести [4].
Существуют несколько методов задания классов состояний объекта [5]:
метод перечисления членов класса; метод общности средств; метод кластеризации.
Когда состояние объекта можно представить в виде вектора чисел, определяющее геометрическое расположение состояния в пространстве, координатами которого являются признаки описания состояния, говорят о кластеризации состояния [5, 6].
Группа состояний объекта, образующих в пространстве описаний компактную в некотором смысле область, называется кластером. Реализация метода кластеризации в интеллектуальной системе (ИС) определяется взаимным пространственным расположением кластеров в пространстве. Если кластеры, соответствующие разным классам, разнесены достаточно далеко друг от друга, можно воспользоваться классификацией по какой-либо из метрик. Среди множества алгоритмов кластеризации наиболее известны алгоритм ISODATA и алгоритм мак-сминного расстояния [7]. При работе со сложными объектами кластеры могут перекрываться и/или иметь размытые границы, что происходит в результате неполной или нечеткой информации о состоянии объекта. В этом случае применяются методы разбиения пространства состояний, оперирующие понятиями теории нечетких множеств [8].
Алгоритм кластеризации нечетких с-средних. В 1981 г. Дж. К. Беждек (J. C. Bezdek) обобщил алгоритм ISODATA на случай произвольных нечетких многообразий и предложил для этого алгоритма название нечетких с-средних (FCM, Fuzzy C-Means). Пусть X мно-
жество состояний некоторого объекта, Ц, Ц2, ..., Ц. - функции принадлежности нечетким кластером ¥1, ¥2, ..., ¥к. Нечеткие кластеры образуют нечеткое покрытие множества X в том и только в том случае, если
Ц1(х) + ц2(х) + ... + ц(х) > 1, \ZxeX. Качество нечеткого покрытия можно оценить при помощи следующей характеристики:
J Д) = min (д (х))21X -
где ¥1, У2, Ук - центры кластеров, V/ е Ь -
векторное пространство с нормой || ||, порожденной скалярным произведением.
3(1) оценивает среднеквадратичные отклонения состояний из X относительно центров V1,
У2,..., Ук.
Шаг 1. По одному из алгоритмов кластер-анализа (например, КОБАТА), производится начальная классификация состояний по кластерам, причем 1(х), / = 1, к, характеризует близость состояния х центру /-го кластера.
Шаг 2. Центры кластеров уточняются при помощи формулы:
X (1(х))2 х ________
V = ^, / = 1, к , х е X е Ь .
I (Д (х))2 ’
Шаг 3. Строится новое покрытие ¥1, ¥2,..., ¥к, описываемое при помощи
(1, /и2, ..., 1) в соответствие с правилом:
1
х - V
Е
j=1
\ •
2
ill J
Шаг 4. Вычисляются отклонения Т величины ц = (1, /и2, ..., 1) от ¡1. Если 8< е- некоторого порога, то алгоритм завершен. Иначе производится переход к шагу 2.
Размер обучающей выборки, необходимой для построения покрытия пространства состояний объекта кластерами, относится к числу неопределенных параметров, которые должны быть определены в процессе обучения.
При помощи алгоритма нечеткой кластеризации определяется не принадлежность состояния х кластеру ¥, а до какой степени х принадлежит к ¥.
2
2
1
Пусть в процессе кластер-анализа было построено нечеткое покрытие пространства состояний объекта нечеткими кластерами ¥1, ¥2,..., ¥к и на вход ИС подается текущее состояние объекта Б0 В процессе распознавания Б0определяется множество значений 1102,..., 1ак, характеризующее соответствие состояния Б0 каждому кластеру ¥, / = 1, к . Если получаемые значения 1а приводят к выполнению соотношения 101 + 112 + ... + 11к< 1 или шахг 1 < Т, где / - номер кластера, Т - некоторый порог, то принимается решение о создании нового нечеткого кластера ¥к+1, центром которого является Б0.
В процессе классификации текущего состояния объекта Б0 может быть сформирован новый кластер к + 1 и каждому /-му кластеру
(/ = 1, к ) должен быть поставлен в соответствие диагноз (в случае системы диагностики) или управляющее воздействие на объект (в случае системы управления объектом), соответствующие данному состоянию.
Учет неполноты информации о состоянии объекта (ситуации, в которой находится объект) заключается в следующем. Пусть для признаков описания состояния объекта х1, х2, ..., хq неизвестны их значения в некоторой ситуации
Бг. Тогда соответствующий элемент акг, к = 1, q, характеризующий степень сходства ситуации 8 и центра кластера 2. имеет значение 0,5, что означает неопределенность в отношении этого признака при сравнении Б, и 2. Чем больше число неопределенных признаков q и выше вес
признаков й, к = 1, q, тем ниже качество классификации состояний.
Ситуационный логический вывод. Для
определения состояния объекта управления необходимо сравнить входную нечеткую ситуацию Б о с каждой нечеткой ситуацией из некоторого набора типовых нечетких ситуаций
Б = (Б1, Б2, ..., Б^}. В качестве меры для определения степени близости нечеткой ситуации Бо нечеткой ситуации Б/ еБ (геК=(1, 2, ...,Щ могут использоваться степень нечеткого включения нечеткой ситуации Б о в нечеткую ситуацию Б/; степень нечеткого равенства Б о и
Б/; степень нечеткой общности Бо и Б/; а также другие меры близости. Выбор меры близости определяется особенностями объекта управления и организацией блока принятия решений в ИС.
Пусть ~ = ^ЫуУуН 8. = (<ЫуУу>}
(уеУ) есть некоторые ситуации. Тогда степенью включения ситуации Б/ в ситуацию Б. [3]
обозначается величина у(Б/, Б.), определяемая выражением:
у(~ Л ) = &у(1б, (У),1б, (У)\ (3)
уеУ
где у(иБ/(у), ЛБ(у)) вычисляется следующим образом:
у(1б/ (у),1б. (у)) = & (11 (Т/ ) ^ 1Т ) (4)
1еЬ
Здесь у(/ЛБ/(у), Щ(у)) является степенью включения нечеткого множества №(У), в нечеткое множество [ЛБ/у).
Считается, что ситуация 8г нечетко включается в ситуацию Б ., Б/ е Б . если степень
включения Б/ в Б ., не меньше некоторого порога включения е [0,6; 1], определяемого условиями управления, т.е. у(Б/, Б .) >1Ыс.
Существование двух взаимных включений ситуаций Б/ и Б., означает, что при пороге
включения ¿/пс ситуации Б/ и Б. примерно
одинаковы. Такое сходство ситуаций называется нечетким равенством, и степень нечеткого
равенства 1(Б/ , Б . ) ситуаций Б/ и Б . определяется следующим образом:
1( ~~ ) = у(~, 8. )& у(~, ~ ). (5)
После преобразований (5) можно получить
1(~/,) = & 1(18 (У),(1з, (у)) (6)
уеУ ■>
где /л(м&(у), ЛБ](у)) вычисляется следующим образом:
1(1б/ (у), (1б,- (у)) = & ((118. (Т) ^
1 3 1еТ 81
^ 11Б. (Т] ))& (11Б. (Т/ ) ^ 11Б^ (Т] )))
Считается, что ситуации Б/ и Б. , нечетко
равны, Б/ ~ Б., если 1Б/, Б.) >*, * е [0,6; 1],
где * - некоторый порог нечеткого равенства ситуаций.
Нечеткой (р - д)-общностью ситуаций называется [3] такое сходство ситуаций, когда нечеткие значения всех признаков в ситуациях нечетко равны, кроме нечетких значений не более, чем q признаков. Если ситуации Б/ и Б. ,
описываются р признаками, то для их (р - ф-общности достаточно нечеткого равенства р - q признаков из множества.
Если признаки, при помощи которых описывается объект управления, не зависят друг от
друга, то из некоторой ситуации Б/ можно перейти в любую ситуацию Б. имеющую (р - ф-
общность с ситуацией Б/ , применением не более чем q локальных (действующих на значение только одного признака) управлений.
Пусть Б/ = ^ЫуУуН Б/■ = (<ЫуУу>}
(уеУ) есть нечеткие ситуации. Тогда степень (р - д)-общности км(Б/, Б.) ситуаций Б/ и
Б., определяется выражением
кр—q (Б/,Б.) = & 1(1 Б/ (у ), 1Б / (у)),
Р 4 * уеУ\Уq 1 ]
где \Уд\ <q, признак ук принадлежит Уф если
1(1Б/ (Ук ),1б.(Ук)) < *.
При Уд = 0 ситуации Б/ и Б. , нечетко равны.
Аналогично определению нечеткого равенства считается, что ситуации Б/ и Б., имеют
(р - д)-общность, если км(Б/, Б.) > *.
Пусть множество возможных состояний объекта управления задается набором Б эталонных нечетких ситуаций. Предполагается, что множество эталонных ситуаций Б полно. Каждой нечеткой ситуации Б/ е Б на основе экспертной информации ставится в соответствие управляющее решение г/ е Я, где Я - множество управляющих решений, используемых для управления объектом. Нечеткий ситуационный логический вывод сводится к распознаванию
входной нечеткой ситуации Бо , описывающей текущее состояние объекта управления, и выдаче соответствующего ей управляющего решения из множества Я. Для распознавания нечеткой ситуации можно предложить два способа:
метод «ближайшего соседа» в пространстве эталонных нечетких ситуации;
выдача управляющих решений с учетом всех эталонных ситуаций.
Для этого должна использоваться некоторая мера сходства нечеткой ситуации Б0 эталонами из множества Б .
В качестве меры сходства нечетких ситуаций наиболее предпочтительны степень нечеткого включения нечетких ситуаций и степень нечеткого равенства. Обе эти меры состоят в вычислении степени сходства в интервале [о; 1]. Набольшая степень сходства равна 1, наименьшая - о. Степень сходства о,5 означает полную неопределенность.
Для оценки равенства или неравенства нечетких ситуаций, включения или не включения вводятся пороги нечеткого равенства и нечеткого включения * из интервала [о, 6; 1]. Считается, что нечеткая ситуация Б о нечетко включается или нечетко равна нечеткой ситуации Б , если
к~о, ~) > *;
у(Бо,Б)&у(Б,Бо)>* соответственно.
По методу "ближайшего соседа" считается, что объект управления находится в эталонной
ситуации Б/ е Б, имеющей наибольшую степень сходства с нечеткой ситуацией Бо , а на объекте управления должно отрабатываться управляющее решение г е Я.
По второму методу результирующее управляющее воздействие г определяется объединением всех управляющих решений г е Я, модифицированных в соответствии со степенью сходства эталонных ситуаций Б/ е Б с текущей ситуацией Бо .
Применение предложенной методики управления сложным объектом в условиях нечеткой исходной информации может быть эффективным в случае большого количества не-
зависимых входных и выходных параметров, характеризующих состояние системы.
Примечания:
1. Лохин В.М., Захаров В.Н. Интеллектуальные системы управления: понятия, определения, принципы построения / Сб. научи. статей «Интеллектуальные системы автоматического управления / Под. ред. ИМ. Макарова, В.М. Лохина. - М.: ФИЗМАТЛИТ, 2оо1. с. 25 - 38.
2. . .
и его применение к принятию приближенных решений. М.: Мир, 1976. 168 с 3. . ., . ., . . -
туационные советующие системы с нечеткой логикой. - М.: Наука, 199о. 272 с.
4. . . - :
// -
фикация и кластер / Под ред. Дж. Вэн Райзина. -М.: Мир, 198о. С. 7-19.
5. ., . -
разов. - М.: Мир, 1978. - 415 с.
6. ., . сцен. - М.: Мир, 1976.
7. . .
МАТЬАБ и &22уТЕСН. - СПб.: БХВ-Петербург, 2оо3.
8. . .
- //
Классификация и кластер / Под ред. Дж. Вэн Райзина. - М.: Мир, 198о.