Секция «Математические методы моделирования, управления и анализа данных»
Таблица 1
Задача оптимизации Множество правил Покрытие отрицательных объектов Покрытие положительных объектов Степень правила Точность классификации, %
Оптимизационная модель с ограничением, исключающим захват правилом объекта другого класса Отрицательные 172 0 4 95
Положительные 0 106 4 96
Оптимизационная модель с ограничением, позволяющим покрытие правилом объекта другого класса Отрицательные 250 5 2 98
Положительные 5 127 4 95
Таблица 2
Задача оптимизации Множество правил Покрытие отрицательных объектов Покрытие положительных объектов Степень правила Точность классификации, %
Оптимизационная модель с ограничением, исключающим захват правилом объекта другого класса Отрицательные 61 0 4 67
Положительные 0 7 4 85
Оптимизационная модель с ограничением, позволяющим покрытие правилом объекта другого класса Отрицательные 61 5 4 71
Положительные 5 7 4 78
Проведенные эксперименты показали высокую точность классификации для решения задач диагностики медицинских заболеваний. Степень правил в данных задачах небольшая, поэтому построенные правила являются наглядными и простыми для классификации объектов без помощи вычислительной системы.
Библиографическая ссылка
1. Головенкин С. Е. Гулакова Т. К., Кузьмич Р. И., Масич И. С., Шульман В. А. Модель логического анализа для решения задачи прогнозирования инфаркта миокарда // Вестник СибГАУ. Вып. 4 (30). 2010. С. 68-73.
© Кузьмич Р. И., Масич И. С., 2011
УДК 519.68
Д. В. Малухин Научный руководитель - В. В. Тынченко Сибирский государственный аэрокосмический университет имени академика М. Ф. Решетнева, Красноярск
КОЭВОЛЮЦИОННЫЙ ГЕНЕТИЧЕСКИЙ АЛГОРИТМ ФОРМИРОВАНИЯ СЕТИ КОХОНЕНА ДЛЯ ДВУМЕРНОГО ВХОДНОГО ПРОСТРАНСТВА
Рассматривается коэволюционный генетический алгоритм, позволяющий формировать сеть Кохонена. Алгоритм не требует от аналитика задания таких настроек, как характер уменьшения скорости и радиуса обучения, что позволяет использовать его даже человеку, не имеющему большого опыта работы с самоорганизующимися картами Кохонена.
Нейронные сети, называемые самоорганизующимися картами Кохонена (СКК), представляют собой одну из разновидностей искусственных нейронных сетей, принципиальное отличие которой заключается в том, что такие сети используют неконтролируемое обучение - когда сеть подстраивается не под эталонное значение выхода, а под закономерности во входных данных [1] СКК могут использоваться для решения разнообразных задач, таких как кластеризация, прогнозирование, поиск закономерностей в больших
массивах данных, выявление наборов независимых признаков, сжатие информации.
Для обучения СКК необходимо задать множество настроек алгоритма обучения. По большинству настроек существуют довольно универсальные рекомендации, но имеются настройки, например, характер изменения скорости и радиуса обучения или количество эпох обучения, выбор которых полностью ложится на плечи аналитика. При отсутствии у аналитика достаточного опыта в использовании алгоритма
Актуальные проблемы авиации и космонавтики. Информационные технологии
формирования СКК возникает опасность некорректного построения сетевой модели, а, следовательно, некорректной интерпретации исследуемых данных.
Для решения данной проблемы был разработан алгоритм формирования нейронной сети Кохонена (НСК), не требующий от аналитика задания малопонятных для него настроек.
В процессе обучения НСК нейроны сети по очереди меняют свое положение во входном пространстве. Каждый нейрон стремится занять такое положение, при котором в его области Вороного [2] окажется максимально возможное количество векторов обучающего множества. При этом перемещение нейрона производится таким образом, чтобы в новом положении он не нарушал структуру НСК. Структура НСК считается нарушенной в том случае, если среди ребер, соединяющих нейроны НСК, окажется хотя бы два ребра, пересекающих друг друга.
Для выполнения требования сохранения структуры НСК необходимо проводить инициализацию НСК таким образом, чтобы структура НСК не была нарушена изначально.
Используя условие сохранения структуры НСК, мы накладываем ограничение на размерность входного пространства обучающего множества: рассматриваемый алгоритм формирования НСК применим только в двумерном пространстве.
Перемещение /-го нейрона осуществляется в соответствии с функцией:
^) | |у,- |, структура сети не нарушается;
' [0, структура сети нарушается.
где V / - множество обучающих векторов, находящихся в области Вороного /-го нейрона, — = (х1, ..., хы) - точка в пространстве обучающего
множества Шы.
Поскольку функция /(— ) является многоэкстремальной и многопараметрической, то для нахождения максимума данной функции было принято решение использовать генетический алгоритм (ГА) [3].
Для нахождения максимума указанной функции необходимо сформировать начальную популяцию ГА, а также провести несколько итераций генетического поиска. При этом популяцию индивидов, сформированную в результате работы ГА, можно использовать
как начальную популяцию при следующем поиске максимума функции f (w ) i для того же самого нейрона. В таком случае можно сказать, что для каждого нейрона создается своя собственная популяция индивидов, которая осуществляет поиск лучшего положения своего нейрона в соответствии с функцией
f(W) i.
Таким образом, для формирования НСК используется коэволюционный ГА, в котором популяции борются друг с другом за предоставленное ограниченное количество ресурсов - обучающих векторов.
В процессе работы коэволюционного ГА, НСК переходит в стационарное состояние, когда в области Вороного каждого нейрона оказывается примерно равное количество обучающих векторов. Другими словами, каждый нейрон находится в максимуме своей функции f (w ) i. При переходе НСК в стационарное состояние, работа коэволюционного ГА завершается, а НСК считается сформированной.
Данный алгоритм не требует от аналитика задания таких параметров, как способ подачи обучающих векторов, способ остановки алгоритма (задание количества эпох обучения), характер изменения скорости и радиуса обучения. Переход НСК в стационарное состояние осуществляется автоматически. Также достоинством данного алгоритма является возможность выполнения параллельных вычислений за счет использования ГА.
Недостатком данного алгоритма является то, что он позволяет проводить исследование только двухмерного пространства. Планируется модификация алгоритма для использования его в пространстве любой размерности.
Библиографические ссылки
1. Kohonen T. Self-Organizing Maps. Springer, Berlin. 1995.
2. Препарата Ф., Шеймос М. Вычислительная геометрия: Введение : пер. с. англ. М. : Мир, 1989.
3. Рутковская Д., Пилиньский М., Рутковский Л. Нейронные сети, генетические алгоритмы и нечеткие системы : пер. с польск. И. Д. Рудинского. М. : Горячая линия - Телеком, 2006.
© Малухин Д. В., Тынченко В. В., 2011