Г лущенко Виталий Васильевич
Адыгейский государственный университет, профессор
кафедрыэкономикииуправления,доктортехническихнаук, профессор,академикРАЕН, e-mail:[email protected] Г лущенко Павел Витальевич
Сочинский государственный университет, доцент кафедры информационных технологий, кандидат технических наук, доцент, член-корреспондент РАЕН, [email protected]
МОДЕЛИРОВАНИЕ УПРАВЛЯЮЩИХ ИНФОРМАЦИОННЫХ СЛОЖНЫХ
СЕТЕВЫХ СИСТЕМИ ИЕРАРХИЧНОСТЬ МОДЕЛЕЙ РАСПОЗНАВАНИЯ СИТУАЦИЙ И СОСТОЯНИЙВ НИХ
В работе рассмотрен ряд: актуальных теоретических аспектов моделирования систем с использованием имитационного моделирования и вычислительного эксперимента;основных методов с использованием алгоритмов иерархической классификации ситуаций в управляющих информационных сетевых системах и даны теоретические основы графического представления результатов этого распознавания.
Ключевые слова: управление; организация производства; система; объект; моделирование; модель; алгоритм; имитация; эксперимент.распознавание; классификация; система; прогнозирование; граф.
MODELING OF MANAGING INFORMATION COMPLEX NETWORK ANDA
IERARCHY OF MODELS OF RECOGNITION OF SITUATIONS AND CONDITIONSIN
THEM
In the paper was considered by a number: of topical theoretical aspects of the modeling of systems using simulation and computing experiment; of the basic methods of using algorithms hierarchical classification of situations in managing information network systems and are given theoretical fundamentals of graphic presentation of the results of this recognition.
Key words: management; organization of production; system; object; modeling; model; algorithm;imitation; experiment; recognition; classification; forecasting; count.
Эффективное функционирование различных систем в 21-м веке во многом будут определять управление, качество и информационные технологии.Совершенствованию этой триады во всех сферы экономикив отечественной научной литературе уделяется все больше внимания, но в основном с точки зрениясовершенствования рыночных механизмов управления (РМУ), что крайне важно и нужно. Но приведение в действие РМУ в любой сференемыслимо без качественного функционирования управляющих информационных сетевых систем (СС). Последние являются сложными подсистемами экономических систем, как в материальном производстве, так и
непроизводственной сфере.Поэтому эти управляющие сетевые системы все более нуждаются в рассмотрении их самих как объектов исследования^ целью дальнейшейразработки актуальных теоретических аспектов[5,6,7], имеющих прикладное значение в оптимизации функционирования сетевой системы управления.
I. Моделирование управляющих информационных сложных сетевых систем. Теоретические научные исследования с использованием моделирования, в т.ч. и имитационного [2,3,5,6] на ЭВМ являются фундаментомдля нахождения наилучшей структуры и конфигурации СС, наиболее приемлемого длянейрежима функционирования, рациональной организации производства и диагностики состояния последнего [3]. Как подчеркивается в[5] классификация системного мира моделей весьма широка и приводится ее суженый вариант, приемлемый для нашей работы. Моделирование здесь подразделяется на основных класса: 1. Физическое; 2. Математическое, распадающиеся на две большие группы М1 и М2.
М1 - это аналитическое моделирование (М1-1 - явное аналитическое описание искомых характеристик системы на языке математики; М1-2-приближенные численные методы; М1-3 -качественные методы). М2 - это компьютерное моделирование, когда математическая модель интерпретируется в программу для ЗВМ. Здесь также есть подгруппы: М2-1 - это методы Монте-Карло, использующие методы М1-2. Этими методами вычисляют не берущиеся аналитическим путем многократные интегралы, решают системы уравнений. М2-2 - это методы имитационного моделирования на ЭВМ процесса функционирования системы с сохранением его логической структуры и последовательности его протекания во времени и т.д. М2-3 - методы статистической обработки данных моделирования на основе планирования эксперимента. М2-4 - комплексы имитационного моделирования,
объединяющие все вышеназванные методы компьютерного моделирования М2. Рассмотримдалеетеоретико-множественное представлениесложных сетевых
систем управления.Под системойв общем случае понимают [1] совокупность предметов, которые организованы некоторым образом. Эту совокупность предметов будем называть [3] полем системы, а сведения, которые задают организацию системы - характеристиками. Поле системы можно разделить на группы, содержащие в определенном смысле подобные предметы.
Сложную сетевую систему (СС) можно представить как систему, поле которой состоит, например, из формирователя описания, выделителя признаков, блока обработки информации, блока принятия решений и т.д. Но ту же СС можно рассматривать и как систему, поле которой содержит следующие группы: программные модули, микропроцессоры, различные виды памяти (ОЗУ,ПЗУ, ППЗУ), управляющие устройства, множество АРМов, терминалов и т.п.
Группы в определенном смысле подобных предметов создают основу класса, который имеет свое поле, объединяющее предметы с одинаковыми свойствами. Совокупность этих свойств является характеристикой класса, которая задается совокупностью атрибутов, имеющих смысл для элементов поля этого класса.Атрибут удобно понимать как пару, первый элемент которой является именем атрибута, а второй функцией, определенной на поле класса. В динамических системах такая функцияможет иметь еще один аргумент - время, что приводит к следующему:
Определение 1. Динамический атрибут это пара вида
а=<п,:0,
гдепеТ - имя;Т - количество текстов в некотором алфавите;: - функция, определенная на декартовом произведении некоторого множестваО и непустого множества вещественных чисел Е.
Множество О называется областью динамического атрибута, а множество Е - его существованием.Понятие динамического атрибута позволяет предложить:
Определение 2. Динамический класс - это тройка вида
u=<P,E,G>,
где Р - некоторое множество, задающее область динамического класса;Е -множество вещественных чисел, задающее существование динамического класса^ - множество динамических атрибутов а eG, имена которых различны, а области их существования равны соответственно Р и Е.
Приведенные понятия создают основу для следующего:
Определение 3. Сложная сетевая система - это тройка < U, с, ( >, для которой справедливы следующие условия:
1. U = (u}^0 - непустое множество динамических классов, области которых дизъюнктивны, а существования равны;
2. С - двузначная булева функция, определенная на декартовом произведении Х х Е, где Х - объединение областей всех динамических классов на U, а Е - их общее существование;
3. ( - подмножество U, задающее главную базу в системе;
4. Пусть AeU, aeA - произвольный динамический указательный атрибут из характеристики А, х - произвольный элемент из области А йе Е. Тогда, если С (хД) = true; то либоа (x,t) = none, либо С (а (хД), t) = true;
5. Если С (х,^ ) =true для х е X,tie Е и если С (хД2) = false для некоторогоt2 е ЕД2>^ то С (хД) = false для всех^2.
Множество Х назовем областью СС; Е - ее существованием; объединение характеристик всех элементов из U - характеристикой (каркасом) СС. Запись С (х, t) читаем: элемент х в момент времени t - присутствует в СС. Для С(хД2) = false значения любых атрибутов теряют смысл.
Дизъюнктивность полей динамических классов предполагает, что состояние СС для любого момента времени существования является статической системой. Это вытекает из следующего Утверждения 6.1.
1. Пусть t - момент времени существования СС. ОпределимS(t) как множество, содержащее пары вида <P,G>, каждой из которых соответствует динамический класс из каркаса U СС, так что Р содержит все элементы х из
области А, для которых С (x,t) = true, aG содержит пары вида <n, f>, гдеГ-функция, заданная на Р, для которой существует динамический атрибут из характеристики А, так что его имя равно n Hf(x)= a(x, t) для всех х є Р. ТогдаS(t) является статической системой, характеризующейсостояние СС в момент времениі
Изменение значения С (х, t) сfalse rntrue для одного и того же х свидетельствует о входе элемента х в систему, противоположное изменение - о выходе элемента х из системы. Инфинум множества тех t для которых С (хД) = true, называем временем входа элемента х (в систему), супренум того же множества - временем выхода элемента х.
2. Пусть В - некоторое множество динамических классов каркасаи СС <U, С, 33 >,Y объединение областей всех классов из В. Говорят, что В является псевдобазой СС, если справедливо С (хД)== true (V xєY; А tє Е).
Введем множество Н, которое представляет собой объединение трех множеств (H1, Н2, Н3) в случае выполнения следующих условий: если а - динамический атрибут из Н и
a(x.t) є Y(Vx є Y;Vt є E), то аєНі; если а - динамический атрибут из Н и
a(x,t) є X \ Y, то аєН2; если а - динамический стандартный атрибут, то аєНз.
Другими словами, в Н не существует атрибута, значения которых для определенных элементов были бы в Y, а в двух других в Х \ Y.
3. Пусть для каждого атрибута а єН1, для каждого х из его области и для каждого^ є Е и2є Е.
Тогда В называется базой СС. Очевидно, что среди всех баз СС можно выделить, например, типовую или максимальную, и назвать ее главной базой Р системы. При физической интерпретации базе соответствует некоторый устойчивый скелет в конфигурации СС. Главной базой является один из таких
возможных скелетов, что не исключает наличия в СС и других скелетов,в том числе и содержащих главную базу.
Конкретизируем теперь понятие сложность по отношению к системе. Сложность будем определять двояко: информационно и алгоритмически.
Определение 4. Информационная сложность системы^ - это размерность информационного множестваL, описывающих множество динамических классов.
Определение 5. Правилом в СС назовем процедуру сопоставления информационного множества L элементам системного множества баз СС.
Определение 6. Алгоритмическая сложность системы Л - это число операций в алгоритме входа или выхода элемента х в систему.
В СС могут происходить процессы того или иного рода. В таком случае необходимо очерчивать границы этого процесса для последующего наблюдения. Отметим, что эти границы могут быть и размытыми. Ясно, что выделение процесса в СС связано с сужением множеств W и Л. Если обозначить через х процесс в СС, то сужение W и Л запишем такWx и Л х.
Кратко охарактеризуем процедуру наблюдения за процессом СС. Введем в рассмотрение конечное множество {I} = (^,...Д0 - описаний, наблюдений, информации за ходом процесса.Анализируя множество {I} выделим множество допустимых стратегий развития процесса {и}, которое можно разбить на классы {к!,..,kt}. Теперь необходимо создать математическую модель процесса,
правомочность которой определяется выбранным классом^ек.
Очевидно, что каждый класс в стратегии описывается тем или иным алгоритмом. Для определенности назовем ихкачественными, если стратегия развития процесса СС должна удовлетворять некоторым критериям качества, конструктивными, если существуют четкие ограничения для всего процесса в целом иэвристическими, если стратегия развития процесса можно проимитировать, построив разные сценарии его развития в режиме диалога «человек - ЭВМ». В зависимости от того, какую принять форму
описания/стратегии развития процесса, можно говорить об алгоритме процесса Z в формеЕ/.
Рассмотренные выше вопросы позволяют перейти к следующим актуальным вопросам нашей работы.
Теоретические аспекты имитационного моделирования сетевых систем.Имитационной моделью сетевой системы (СС)назовем шестерку^, z2m, М,г ,R> для которой справедливы следующие условия:
1.zi = <Ui,Ci, ( l>иz2 =<U2,C2, ( 2> динамические систем^Ы;
2.m - отображение замыкания X области системы z1 на замыкание области с системьи2;
4. M - отображение характеристики G1cсистемыz1 на характеристику системы
Z2;
4. г - неубывающее отображение существованияЕ1 системы /1на существование системыz2;
5. R - отображение множестваL на некоторое множество бинарных отношений объединения всех стандартных множеств L определено как множество всех <
а, хД>, где а - стандартный атрибут roG, х - принадлежит области атрибута а
и C1 (хД) = true;
6. Если х принадлежит области динамического атрибута а roGi, то т(х) -области динамического атрибута Ма;
7. Если а иЬ принадлежат характеристике одного и того же динамического класса изи1, то Ма и Мь - характеристике одного и того же динамического класса изи2;
8. Пусть хе X1, te Е1. Тогда, еслиС1 (х, t) =true, то C2 (m (x, г (t)))=true;
9. Если а - динамический указательный атрибут из G1, то Ма - также динамический указательный атрибут. Если х является элементом области атрибута а, t е Е1, и C1 (х,t) ==true, то m (а (х, t)) = Ма (m (х), г (t));
10. Если а - динамический стандартный атрибут из G1, то Ма - также динамический стандартный атрибут. Если х является элементом области
атрибутаа, teE^C (x, t) = true, то выполняется отношениеRa, x, t (a (x, t),
Ma(m(x), т (t))).
Г оворят, 4toz2 - моделирующая (имитирующая) система^1 -
моделируемая (имитируемая) система. В случае, когда c^TeMaz2 определена на реальном объекте, она называется имитатором (системы -z1); m - элементной частью; М - атрибутной частью; т - временной частью^ - частью отношениймодели. На рис.1 дано схематичноепредставление имитатора.
Контролируемые факторы
--'** ^ Т-.
у2 Выходные ° параметры
о
° , Уз
Неконтролируемые факторы
Рис. 1. Представление имитатора с использованием “черного ящика”, т.е. изучение поведения входов и выходов, многократный статистический учет и
анализ их изменений.
Отметим, что утверждения, приведенные в пп. 6 и 7, не могут быть обращены: два элемента или атрибута из разных классов моделируемой системы могут быть отображены на два элемента или атрибута одного и того же класса; они могут быть также отображены и на один и тот же элемент или ат-рибут.Данное определение модели можно конкретизировать для отражения, например, специфики моделирования на ЭВМ с разделением времени.
Учитывая предлагаемое определение модели, под имитационным моделированием будем понимать метод исследования СС, основанный на
сц У а2 1 О о о 4
Х1 ► Имитатор
Управляющие х2 ^ факторы о О Хз°>
■ 1 ’W
& а ^2 а ООО i
замене системы z1ее имитаторамz2 и проведении эксперимента с моделирующей системойz2 с целью получения новой информации о системе z1.Очевидно, что имитатор z2 обычно ограниченно соответствует системе z1 в рамках, обусловленных целями исследования.
Критерием истинности имитатораz2 является полезность полученной с его помощью новой информации о системе z1. Чтобы имитатор оказался полезным, он должен обладать двумя взаимосвязанными свойствами:1. Имитатор z2 должен быть экономичным, т.е. позволять достичь целей исследования при меньших затратах ресурсов, чем при использованиинепосредственно системы z1.2. Имитатор z2 должен обеспечивать возможность распространения без существенного искажения новой информации на систему z1, т.е. обладать транзитивностью.
Информация о поведении имитатораz2 тождественна информации о системе - только тогда, когда тождественные z1 и z2, т.е. моделирование отсутствует. При любом моделировании перенос новой информации с имитатора z2 на систему z1 представляет собой логический вывод, когда посылка относится к имитатору z2, а вывод к системе z1. Следовательно, при моделировании неизбежен риск отвергнуть верную для системы z1 гипотезу (ошибка второго рода). Поэтому в имитационном моделировании сформировалось общее направление исследований, предусматривающих разработку методов учета и минимизации риска выводов по аналогии.Можно выделитьсемь основных компонентов этого риска: уменьшение размерности факторного пространства при моделировании; обобщение результатов изучения части (выборки) на целое; аппроксимация неизвестной функции веером моделей; масштабирование входов и выходов системы; погрешности преобразования информации в имитаторе; нормализация случайных величин; оценка параметров имитатора z2 по экспериментальным данным.
Анализ этих семи компонентов риска логических выводов по аналогии показывает, что за исключением первых двух из перечисленных все остальные
составляющие могут быть минимизированы достаточно хорошими формализованными приемами, совокупность которых получила название планирование эксперимента. Последние могут проводиться непосредственно исследователем или выполняться автоматически как по заранее составленному плану, так и последовательно, когда цели нового эксперимента устанавливаются на основе анализа результатов проведенного эксперимента.
Для нашего случая ^ ж2 динамические системы, причем z1 - моделируемая (имитируемая) системам - моделирующая (имитирующая) система. И пусть эксперименты могут иметь иерархическую упорядоченность:!. Состояние имитатораz2 после проведения очередного эксперимента не изменяется и проводится следующий эксперимент.2. Имитаторz2 после проведения каждого эксперимента возвращается в общее для всех экспериментов начальное состояние.3. Результаты эксперимента приводят к изменению имитатора, т.е. переходят к построению и исследованию новой модели.Имитационным
экспериментом является совокупность изменений в моделирующей системеz2 в течение одного множества моментов существования этой системы.
Имитационный эксперимент соответствует экспериментутипа 2° либо последовательности экспериментов типа 1°.
Далее обратим на важность такого понятия как имитационное (модельное) время. В общем случае речь идет об обратной трансформации, т.е. в момент времени; значение имитационного времени равно т_1 (;) где t - временная часть модели. Тогда имитационное время является системной переменной
моделируемой системьщ, принимающей в каждый период ее существования значения, равные системному времени моделируемой системы, для которого атрибуты системы принимают значения, соответствующие имитационным значениям. Дадим[3,4] формальное определение имитационного времени с учетом того, что предлагаемое определение имеет смысл тогда, когда временная часть модели является простым отображением на существование имитатораz2.
Пусть ц =^, z2, т, М, т Д> - имитационная модель;Е1 иЕ2 -
существования систем z1 и z2; Е0 - множество всех ; е Е2, для которых существуютS1 и S2 изЕ1 так, чтот ^) <;< т ^2). Тогда системная переменная имитатора z2, значение которойи(;) в каждый момент времени; еЕ0 равноинфинимуму множестваS, гдеS - множество всехSеE1, для которых т (S) =<>, а;0 -наибольший элемент изт (Е1), не больший^, называется имитационным временем.
Если в имитатореz2 значение имитационного времени на бесконечно малую величину отличается от действительного времени, то говорят об имитационном эксперименте в реальном времени. В этом случае для временной части имитатора должно соблюдаться условие \т^) - ^ < г где £ - бесконечно
малая величина, определяемая целью имитационного моделирования.
Приреализации имитатора на ЭВМ, последняя управляется имитационной программой, которая последовательно изменяет содержимое отдельных полей базы данных и в определенные моменты времени достигает состояния, которое отображает соответствующие значения атрибутов моделируемой системы z1 в определенные моменты (на определенном интервале) ее существования. Вычисления между двумя подобными состояниями и называются имитационным шагом. Тогда вычислительный эксперимент - это некоторая последовательность имитационных шагов.
Существуют два типа планов активных экспериментов: классический и многофакторный. Классический план заключается в том, что на одном уровне фиксируются все независимые входные факторы (переменные), кроме одной, которая изменяется на всем интервале значений, далее действия повторяются с тем отличием, что ранее варьируемый фактор фиксируется, а следующий изменяется.Проведенный таким образом эксперимент характеризуется большим числом опытов и позволяет получить информацию для получения ряда однофакторных зависимостей выходной характеристики объекта от каждой независимой переменной (х1,х2,...,хк).
Однако при таком проведении эксперимента построение единой математической зависимости, связывающей все факторы с выходной характеристикой объекта (функцией откликаy1еY), практически невозможно.Для получения подобных зависимостей следует использовать многофакторные планы экспериментов. Здесь каждый фактор может принимать одно из нескольких возможных значений, называемых уровнями. Фиксированный набор уровней факторов, с одной стороны, задает одно из возможных состояний «черного ящика», а с другой стороны является условием проведения одного из опытов эксперимента. Каждому такому набору соответствует опытное значение функции отклика. Совокупность уровней факторов (факторное пространство) определяет полное множество различных состояний «черного ящика» имитатора и одновременно характеризует числоКоп различных опытов эксперимента:
Коп =рк (1)
где к - число факторов, р - число уровней факторов.
Основная идея планирования многофакторного эксперимента заключается в одновременном варьировании всех факторов на заданных уровнях по определенным правилам. Такой подход к определению эксперимента позволяет рационально выбрать число уровней факторов, свести к минимуму количество проводимых опытов и получить необходимую информацию для определения аналитических зависимостей между входными и выходными переменными «черного ящика».
Здесь полагаем необходимым отметить ряд важных позиций к вышесказанному. Развитие современных языков имитационного программирования, и в частности GPSS/H, позволяет довольно эффективно осуществлять различные виды моделирования на ЭВМ. При исследовании объекта существуют две крайние точки: первая, при представлении модели средствами математики и логики возникает абстрактный образ реального объекта, т.е. точка абстракции, вторая, при исследовании образца реального объекта в качестве модели имеет место конкретное исследование, т.е. точка конкретики. Моделирование, в том числе и
имитационное, находится в промежутке между этими двумя крайними точками [5]. Модель отвечает на вопросы: что будет, если...,каковы размеры..., насколько корректны упрощениями т.д. Модель стала одним из важнейших способов получения информации о вновь создаваемой или исследуемой системе.
II. Иерархичность моделей распознавания ситуаций и состояний управляющих сетевых систем.В современном инженерномкомплексе функционируют подсистемы: зданий и сооружений, энергоснабжения,
электроустановок (включая электрооборудование других подсистем), водоснабжение и канализация, теплоснабжение, газоснабжение, вентиляционные системы, дороги и тротуары, связь, устройства телекоммуникаций и т.д.
Всеми этими подсистемами инженерного сервиса управление осуществляется специалистами-менеджерами посредством интегрированной управляющей информационной сетевой системой, которая, кратко говоря, представляет собой объединенные проводной и/ или беспроводной сетью аппаратные средства (ЭВМ, мониторы, терминалы, принтеры), измерительные, передающие и принимающие устройства.
Из отмеченного можно увидеть важность мониторинга ситуаций и состояния самой данной сетевой системы (СС). Для осуществления этого и своевременного принятия специалистами мер по регулированию или изменения конфигурацию, режима работы по управлению необходимо, прежде всего, решать задачу распознавание (классификация) возможных ситуаций и состояний при эксплуатации разнообразных сетей.
Эту задачу можно решить, используя те или иные известные алгоритмы. Поскольку определенный набор алгоритмов диагностирования [2] существует для решения достаточно большой совокупности задач, то, полагаем, что целесообразно рассмотреть еще не достаточно широко и умело применяемую, а в чем-то еще и малоизученную задачу -
распознавание ситуаций и состояний [3] в сети после возникших нарушенийс точки зрения иерархии, важнейшей системной позиции.
Рассмотрим большую управляющую сетевую систему как объект управления, в которой имеется конечное множество устройств, узлов, терминалов:
X = X„}.
Пусть иерархией Srn X называется система подмножеств (классов, дефектов сети, неисправностей сети), {s : S e X}, для которой справедливо:
1) X е s; 2) {X} g s, i = 1,n; 3) если классы s и s' из S имеют не пустое пересечение, то s' es, либо ses'.
Например, если X = {X1V.., X7}, то система подмножеств
s = {{Xi},i=l,7,{X1,X2},{X3, X4,X5}{X1, X2, X6}; X} является иерархией на X.
При этом исследование структуры иерархий удобно вести в терминах теории графов [4]рис.2. Графом G = G (S) иерархии srn X называем ориентированный граф (V, Е), вершины V eV которого соответствуют множествам seS, а ребра е еЕ - парам (s', s), таким, что: s'^s, s'es, и в s не существует s * s, для которого s'e s es. Как правило, ребро е = (s', s) изображается стрелкой с началом s' и концом s.
Так граф G = (V, Е) иерархии s из вышеприведенного примера имеет ножество вершин: V = V = {Xi}, i = 17 ,v, = {X1, X,},v, = {X3, X4, X,},vm = {X1, X2, Xt},v„ = X}
В графе иерархии вершина может быть концом нескольких стрелок, но как следует из третьего вышеприведенного условия, она является началом только одной стрелки.
В отличие от сказанного иерархию будем называть бинарной, если любое множество Ses, содержащее более одного элемента, является объединением множеств S' и S" из s, где S' nS" = 0.
VI м2 Уь ^3 У4 У5 У7
Рис. 2. Граф G=(V,E) иерархии s
Иерархия s из примера (рис. 2) не является бинарной, так как множество {Х3, Х4, Х5} нельзя представить в виде объединения двух множеств из s. Нетрудно представить, что в любой бинарной иерархии s разбиение множества Ses, т.е. представление S =s' однозначно. Иерархия является бинарной только тогда, когда в ее графе каждая вершина, соответствующая множеству, содержит более одного элемента, является концом двух стрелок. Таким образом, иерархической классификацией данного множества объектов (подсистем) сети
X = {Хп},, назовем построение иерархии 8 на I, отражающей наличие однородных, в определенном смысле, классов X и взаимосвязи между классами. Алгоритмы иерархической классификации (распознавания)
подразделяются [3] на дивизимные, в которых множество X постепенно разделяется на все более мелкие подмножества, и агломеративные, в которых
точки множества X постепенно объединяются во все более крупные
подмножества. Графы иерархий, полученных при помощи этих алгоритмов, называются соответственно дивизимными и агломеративными[3]. Если их изобразить на плоскости так, как на рис. 3, то видно, что они описывают процедуру классификации при движении вверх по оси ординат. Поэтому дивизимные алгоритмы называют также нисходящими (движение против стрелок), а агломеративные - восходящими (движение вдоль стрелок).
В основе алгоритмов иерархической классификации лежит тот или иной критерий качества Q(S1,...,Sk) разбиения множества S на подмножества S1,...,Sk. Обычно используются бинарные алгоритмы, когда k=2. В этом случае Q (S1, S2) имеет смысл близости р^ь S2) между множествами S1 и S2. Далее, говоря об алгоритмах иерархической классификации, будем иметь в виду только бинарные алгоритмы.
Дивизимные алгоритмы. Они строятся на принципе разделения множества состояния сетей S на подмножества (S*, S2*), такие, что
(S1,S2) = arq max p(S,,S2). (2)
S1 uS2=S 1
В реально используемых алгоритмах берется некоторое приближенное решение задачи (1), так как точное решение ее трудоемко даже при относительно небольшом объеме элементов в S. Вид меры близости р (S1, S2) может меняться в ходе алгоритма. Изложим на примере основные приемы разделения класса S на подклассы S1 и S2 в дивизимных алгоритмах.
Пусть X = {X1,...Xn}, где X = (хг(1),..., x(P)) є RP, где R - пространство наблюдения значений X или пространство состояния сетей размерности,Р/р -число признаков - координат. В качестве критерия однородности класса S с X возьмем статистический разброс
Q(S) =Б X - z\\г (3)
X cS
Рис. 3 Графы иерархий, описывающие процедуры распознавания (классификации): а) дивизимная или нисходящая процедура; б) агломеративная или восходящая процедура
1 2 где 7 = —г ^ X - центр класса S и ||Х - Ц - квадрат евклидова расстояния между
Х и Z.
Положим
p(S„S2) = Q(S, иS2)-Q(S,)-Q(S2), S, nS2 =0
(4)
т.е. мерой близости между классами считаем приращение статистического разброса при объединении классов.
Пусть F(S1,S2)=Q(S1)+Q(S2). Для фиксированного класса S имеем: p(SvS2) + F(Sl,S2) = cora/.Следовательно, для решения задачи (2) разделения классов сетей S достаточно найти (Sj*,S2*) = arq min F(Sx,S2). (5)
S, и S2 = S
Функционал F (Б1, Б2) является функционалом качества разбиения Б на подклассы Б1 и Бз в методе 2-средних,поэтому для получения классов §* и S*2 можно использовать алгоритмы 2-средних (содержательно процедура алгоритма к - средних направлена на поиск разбиения Б* выборки X с минимальным разбросом).
Опишем далее распространенный способ разбиения множества Бна подмножества с помощью линейного классификатора:
§ = {X е S : уХ < а}, S2 = {X е S: уХ > а}, где V е RP ,| V = 1.
Для данного вектора V е RP ,| V = 1, рассмотрим проекцию
V: RP ^ R1 : X ^ у = V X и обозначим через ^образ множества Б. Положим р( ^ Б2) = Q(§ и §2) - Q(S1) - Q(§2), где Q - статистический разброс.
Пусть у1 >у2 > ...>ут - упорядоченная числовая последовательность элементов множества § е Я1. Так как ищем на прямой точку а, разделяющую эту последовательность на две части, то
€ = {Уl,..., Ут1} €2 = €2(т1) = {У т\+\,..'Ут } , (7)
для некоторого т1, т.е. в этом случае вместо метода двух средних можно применить для решения задачи (5) метод последовательного перебора. Вы-
Пусть
Тогда имеет место формула
где т,т1 ,т2 - соответственно число элементов в множестве Б, Б1 и Б2. Следовательно, для фиксированногоБ достаточно найти:
(§1,£2*) = ага тах F(§1,§2). (6)
§ и Я, = §
числив числовую последовательность }<Kmi) = Fi( ^( m1),§'2(ml)),m1 = 1,m -1} получим пару («1 = ^ (m'), S' = S- (m') I, где да'= arg max ^(да1)и, следовательно,
1<mi <m-1
S' = X e S : vX < j-m-t S-' = « \ S'
Таким образом описан алгоритм нахождения порогового значения а для линейного классификатора, задаваемого вектором v e RP,||v|| = 1. В качестве V
обычно берется какой либо координатный вектор либо собственный вектор корреляционной матрицы множества S е RP. Вектор V можно получить также как решение задачи целенаправленного проектирования, дающего проекцию RP ^ R1,для которой S ={у1,...,jm } - наиболее неоднородная числовая выборка в смысле некоторого критерия.
Алгоритм иерархической классификации множества X из n элементов состоит из (n-1) шагов. На вход дивизимного алгоритма подается все множество X. На k - ом шаге получается разбиение S(k) множества X на (k+1) не-пересекающихся множеств (классов) S1(k),...,S(kk+\, называемое разбиением k - го уровня.
n+1
Итоговая иерархия S представляет собой систему S = у s(k), образованную
к+1
вложенными разбиениями S(0) з S(1) з... з S(n-1). Здесь S(0) = X. Следует напомнить, что разбиение S(1) = (S1(1),..., SJ(i1)) вложено в разбиение S(2) = (S1(2),..., Sk22)),
если каждый класс из S(1) является подклассом некоторого класса из S(2). Если на k - ом шаге получается разбиение S(k) , все классы которого удовлетворяют выбранному критерию однородности, то алгоритм обычно останавливается.
Агломеративные алгоритмы. На вход агломеративного алгоритма подается разбиение S(0) = (S^,...,sno)), где S(0) ={хг}. Разбиение k - того уровня
имеет вид S(k) = (S1(k),...,S(n-к) и строится из разбиения S(k-1), k> 1, путем
объединения пары классов (S', S -), где
Si, S( gS (j
Итоговую иерархию S образует система вложенных разбиений
S(0) с S(1) с... с S(n-1).Здесь S(n-1)= X.
Отметим, что иерархическая классификация при помощи бинарного алгоритма всегда дает бинарную иерархию. Заметим, что иногда иерархической классификацией множества X называют построение систем вложенных разбиений
S(0) з S(1) з ... з S(n-1), где S(0) = X или
S(0) с S(1) с ... с S(n-1),, где S(n-1) = X
Предыдущие рассуждения показывают эквивалентность такого определения иерархической классификации и данного ранее определения. В агломеративных алгоритмах могут использоваться разнообразные меры близости p(S2,S2). Необходимо отметить, что мера близости (4) удовлетворяет рекуррентному соотношению:
P(Se, S(m, q) = aPem + (Pem + ypmq + Ô(PemPeq ), (9)
где Se и S(m, q) - классы объектов; a, (,у,5 - числовые коэффициенты, значения которых и определяют специфику процедуры, ее нацеленность на решение той или иной экстремальной задачи. Так, например, полагая a = ( = -5 = 1/2, и у = 0, приходим к расстоянию, измеряемому по принципу “ближайшего соседа”. Если же положить a = ( = 5 = 1/2 и у = 0, то расстояние между двумя классами определится как расстояние между двумя самыми далекими элементами этих классов, по принципу “дальнего соседа”. И наконец, выбор коэффициентов соотношения (9) по формулам
n n
a =----, ( =------q—, у = 5 = 0
nm + nq nm + nq
приводит к расстоянию Pch между классами, вычисленному как среднее из расстояний между всеми парами элементов, один из которых берется из одного
класса, а другой - из другого (п - число объектов, образующих группу Sj). Кроме того, если для вычисления воспользоваться следующей модификацией формулы (8):
2 п„ + пга 2 пе + па 2 п 2 /1/Лч
Ре{т, а) =------Рем +---------Реа----------Рта > (10)
п + п + п п + п + п п + п + п
е т а е т а е т а
то соответствующий агломеративный иерархический алгоритм обладает тем свойством, что на каждом шаге объединения двух классов приводит к минимальному увеличению общей суммы квадратов расстояний между элементами внутри классов.
Отметим, что мера близости (9) обладает рядом важных свойств, которые обеспечивают широкое использование ее при решении задач классификации (распознавания).
Рассмотрим далее суть графического представления результатов иерархической классификации. Алгоритмы иерархической классификации применимы для классификации (распознавания) множеств V: ^ ^ Я(1)
относительно небольшого объема, так как при программной реализации алгоритмов требования к объему оперативной памяти ЭВМ и время счета
быстро растет с ростом числа элементов в множестве X, хотя современные ЭВМ все более и более снимают эту проблему. Эти алгоритмы позволяют в ряде случае получить более полный анализ состояния структуры сети исследуемого множества объектов.
Так, граф классификации дает представление о взаимосвязимежду разбиениями $(к1) и S(k2) на разных уровнях, и если принято решение
остановиться на разбиении S(k) множества X, то для каждого элемента X е X можно оценить степень его принадлежности к классу S(lk) для некоторого 1 при помощи пути (простой цепи), соединяющеговершины графа, соответствующего Х и классу S(¡k).
Существенным преимуществом алгоритмов иерархической классификации (распознавания) является возможность наглядной интерпретации проведенного анализа. Имеется большая свобода в построении на плоскости данного графа иерархии. Изучая различные изображения сети, согласованные с ее структурой, можно получить ряд нетривиальных результатов об исследуемом множестве объектов сети управления.
Основы метода построения на плоскости графа иерархической классификации (распознавания). Опишем общую схему построения на плоскости графа агломеративной классификации. Для получения изображения графа дивизимной классификации применимы те же методы, только во всех построениях необходимо поменять на противоположное направление оси ординат (рис.3).
Под индексацией V иерархии будем понимать отображение V: я ^ Я(1), ставящее в соответствие множеству Sєs, число V (З) таким образом, что:
1) V (З) = 0 только тогда, когда S состоит из одного элемента;
2) V (З') < (З) для каждой пары (З', S) из s, такой, что З'сЗ.
Строгой же индексацией V иерархии s назовем ее индексацию, удовлетворяющую условию:
2’) v(8') < v(8) для каждой пары (З', S) из s, такой, что З'сЗ и З'^.
Пусть ^, V) - некоторая индексированная агломеративная иерархия З на
множестве X = (Х1,...,Хп}, построенная при помощи меры близости р(Бх,S2).
Вершины графа этой иерархии, соответствующие множествам {Хг.}, і = 1, п,
обозначим через X, а вершины, соответствующие Sєs, |З|>1, через vs . Допустим, что вершины vs1и vs2 нанесены на плоскость, т.е. можно записать в координатах: V = (У ^ ) и V = (у8 , ^).. Тогда, если 8 и 82 = 8 є я, то положим
V = ^ + ^2Х v(S) ^
и соединим точки и vs2cvs.
Начальный шаг построения обеспечивается тем, что, по предположению, вершины ^располагаются на оси абсцисс. На этой оси они упорядочиваются так, чтобы в итоговом изображении графа минимизировать число пересечений ребер графа. Например, если V -строчная индексация, то можно так упорядочить вершины V, 1 < 1 < п, , что ребра будут соединяться только в вершинах.
Таким образом, каждая индексация задает изображение графа. Если в пакетах программ реализовывается графическое представление агломеративной иерархии, основанное на строгой индексации V, ставящей в соответствие множество Sеs номер шага, на котором это множество было включено в иерархию, то в этом случае индексация V любой иерархии s принимает значения
0.1.....(п-1).
При наглядной интерпретации результатов классификации большое значение имеет оцифровка изображения графа, т.е. дополнительная информация о структуре сети исследуемой совокупности объектов несет распределение на
отрезке [0,1] числовой последовательности v(S)/v(X),|^ > 1, S е 5 },
для выбранной индексации V.
Литература
1. Варжапетян А. Г., Глущенко В. В., Глущенко П. В. Системность процессов создания и диагностики технических структур. - СПБ.: Политехника, 2004
2. Глущенко П.В. Техническая диагностика. Моделирование в диагностировании и прогнозировании состояния технических объектов. -
М.: Вузовская книга, 2004
3. Глущенко В. В. Диагностико-прогнозирующие системы управления информационными процессами в сетевых объектах.- СПб.: СПГУВК,
1999
4. Классификация и кластер. (Под ред. Дж. Вэн Дж. Райзина. - М. : Мир, 1980
5. Варжапетян А. Г. Имитационное моделирование на GPSS/H. - М.:
Вузовская книга, 2007.
6.Павловский Ю. Н. Имитационное моделирование и системы. - М.: ВЦ РАН, 2000.
7.Советов Б.Я., Яковлев С.А. Моделирование систем. - М.: Высшая школа, 1998.