Научная статья на тему 'Синтез упругих карт эволюционными алгоритмами'

Синтез упругих карт эволюционными алгоритмами Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
75
34
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Гасанова Т. О., Семенкин Е. С.

В биоинформатике для анализа многомерных данных широко используется метод упругих карт, использующий модель обучения без учителя. Метод упругих карт обладает большей регулярностью и предсказуемостью, чем карты Кохонена, и способен решать те же задачи. В основе метода лежит минимизация «энергии упругой деформации» карты.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Гасанова Т. О., Семенкин Е. С.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Синтез упругих карт эволюционными алгоритмами»

Актуальные проблемы авиации и космонавтики. Информационные технологии

ся к группе технологий, называемых эволюционными алгоритмами. Основная идея предлагаемого метода заключается в адаптации и использовании операторов генетического программирования для автоматического формирования решения, представляющего собой формулу (программу) для вычисления общего решения коллектива нейронных сетей на основе решений полученных от его отдельных членов.

Для исследования эффективности разработанного комплексного подхода формирования коллективов нейронных сетей был проведен ряд численных экспериментов на наборе тестовых задач, включающем в себя задачи аппроксимации функций одной и нескольких переменных различной сложности. В качестве тестовой задачи также были использован набор данных тестов по прогнозированию прочностных характеристик бетона из репозитория UCI Machine Learning Repository [3]. Предлагаемый метод был исследован в сравнении с методом GASEN и двумя другими методами, использующими генетический алгоритм для формирования коллектива и распространенный подход взвешенного усреднения [5] для формирования общего решения (GA-based1 и GA-based2). В [4] показано, что метод GASEN превосходит по эффективности большинство других методов конструирования общего решения в коллективах нейронных сетей, поэтому выбор его, а так же двух подобных методов, для сравнительного исследования позволит судить об эффективности предлагаемого метода в сравнении с большинством других методов, оставленных за рамками проведенного исследования.

В целом, результаты показывают, что разработанный комплексный подход к формированию кол-

лективов нейронных сетей демонстрирует высокую эффективность на всех использованных тестовых задачах. Для задачи прогнозирования прочностных характеристик бетона относительное превосходство предлагаемого составило около 15 %. Для других тестовых задач превосходство метода над другими использованными в ходе тестирования методами находилось в пределах от 50 до 10 %.

Таким образом, можно говорить о том, что разработанный комплексный метод формирования коллективов нейронных сетей не уступает по эффективности другим методам, а для некоторых задач позволяет существенно повысить качество их решения.

Библиографические ссылки

1. Hansen L. K., Salamon P. Neural network ensembles, IEEE Trans. Pattern Analysis and Machine Intelligence 12 (10) (1990). P. 993-1001.

2. Koza J. R. The Genetic Programming Paradigm: Genetically Breeding Populations of Computer Programs to Solve Problems. Cambridge, MA : MIT Press, 1992.

3. URL : http://archive.ics.uci.edu/ml/datasets/Con-crete+Slump+Test.

4. Zhou Z. H., Wu J., Tang W. Ensembling neural networks: Many could be better than all. Artif. Intell. Vol. 137. № 1-2. 2002. Р. 239-263.

5. Perrone M. P., Cooper L. N. When networks disagree: ensemble method for neural networks, in: R. J. Mammone (Ed.), Artificial Neural Networks for Speech and Vision, Chapman & Hall, New York, 1993. Р. 126-142.

© Бухтояров В. В., Семенкин Е. С., 2010

УДК 519.8

Т. О. Гасанова Научный руководитель - Е. С. Семенкин Сибирский федеральный университет, Красноярск

СИНТЕЗ УПРУГИХ КАРТ ЭВОЛЮЦИОННЫМИ АЛГОРИТМАМИ

В биоинформатике для анализа многомерных данных широко используется метод упругих карт, использующий модель обучения без учителя. Метод упругих карт обладает большей регулярностью и предсказуемостью, чем карты Кохонена, и способен решать те же задачи. В основе метода лежит минимизация «энергии упругой деформации» карты.

Несмотря на то, что модели, использующие обучение с учителем, способны решать многие прикладные задачи, в реальности мы редко знаем требуемый выход, поэтому в биологических системах более обоснованной является модель обучения без учителя. Такая модель использует только предъявляемые ей входные векторы, выделяет статистические свойства объектов и группирует их так, чтобы похожие объекты оказались в одном классе, а непохожие - в разных. В настоящее время в биоинформатике для анализа многомерных данных широко используется метод, получивший название «упругие карты» [1]. Метод упругих карт обладает большей регулярностью и предсказуемо-

стью, чем карты Кохонена, и способен решать те же задачи.

Основа метода «упругих карт» - минимизация «энергии упругой деформации» карты, погружённой в пространство данных. После построения сетки остаются неопределенными два параметра, которые можно интерпретировать как упругость карты по отношению к растяжению и упругость по отношению к изгибу. С одной стороны, более упругая сетка является более гладкой моделью данных, обладает большей обобщающей способностью, но, как следствие, хуже описывает отклонения от предполагаемого закона. С другой стороны, менее упругая карта точнее описывает данные, но и воспроизводит при

Секция «Математическое моделирование управления и оптимизации»

этом случайные шумы, которые обычно присутствуют в реальных данных, то есть менее упругая сетка обладает меньшей обобщающей способностью. Известно, что применяемый для решения оптимизационной задачи метод расщепления может сходиться в локальный минимум [1]. Поэтому целесообразно рассмотреть возможность применения в методе упругих карт алгоритмов глобальной оптимизации.

Известно, что эволюционные, в частности - генетические, алгоритмы способны эффективно решать многоэкстремальные задачи оптимизации с целевыми функциями, заданными неявно (таблично, алгоритмически и т. п.) на сложных структурах данных (дискретных, комбинаторных, смешанных) [2]. Генетические алгоритмы являются стохастическими процедурами прямого поиска на множестве бинарных переменных и упомянутые трудности оптимизации не создают для них дополнительных проблем.

В данной работе рассматривается применение гибридного генетического алгоритма для синтеза

упругих карт, решающих задачу кластеризации многомерных данных. Гибридизация состоит в использовании покоординатного спуска для наилучшего найденного решения.

Процедура оптимизации энергии упругой деформации гибридным генетическим алгоритмом и результаты тестирования работоспособности подхода обсуждаются в докладе.

Библиографические ссылки

1. Gorban A. N., Kegl B., Wunsch D., Zinovyev A. Y. (Eds.), Principal Manifolds for Data Visualisation and Dimension Reduction, Series: Lecture Notes in Computational Science and Engineering 58, Springer, Berlin -Heidelberg - New York, 2007.

2. Goldberg, D. E. Genetic algorithms in search, optimization and machine learning. Reading, MA : Ad-dison-Wesley, 1989.

© Гасанова Т. О., Семенкин Е. С., 2010

УДК 519.68

Т. К. Гулакова Научный руководитель - С. С. Бежитский Сибирский государственный аэрокосмический университет имени академика М. Ф. Решетнева, Красноярск

ИССЛЕДОВАНИЕ ЗАВИСИМОСТИ ЭФФЕКТИВНОСТИ РАБОТЫ ГЕНЕТИЧЕСКОГО АЛГОРИТМА ОТ ВЫБОРА ПАРАМАТРОВ ОПЕРАТОРОВ АЛГОРИТМА НА МНОГОЭКСТРЕМАЛЬНЫХ ТЕСТОВЫХ ФУНКЦИЯХ

Проводится исследование работы ГА в зависимости от выбора параметров при нахождении глобального оптимума многоэкстремальных функций вещественных переменных. Исследуется эффективность новых видов оператора рекомбинации.

Выбор эффективных параметров генетического алгоритма [1] является самостоятельной трудоемкой научно-исследовательской задачей. С целью решения подобных задач: во-первых, разрабатываются адаптивные самонастраивающиеся алгоритмы, во-вторых, ведется поиск и оценка новых модификаций стандартных операторов (селекции, рекомбинации и мутации). В данной работе исследовалась эффективность двух новых модификаций оператора рекомбинации (побитовое сравнение, «псевдо-митоз») наряду с остальными операторами.

Под эффективностью понимается надежность, т. е. процент успешных запусков алгоритма в общем числе прогонов. Общее число прогонов равняется 100.

Исследование заключается в сравнении результатов работы алгоритма на принципиально разных по свойствам многоэкстремальных функциях Грин-вака, Растригина и Розенброка при вариации различных параметров. Вариабельные параметры алгоритма представлены в табл. 1.

Область поиска изменяется в зависимости от выбранной функции. При этом такие параметры как размерность популяции, число поколений и вероятность скрещивания остаются неизменными в процессе исследования. Эти данные представлены в табл. 2.

Агрегированные результаты исследования приведены на рис. 1.

Таблица 1

Тип рекомбинации Вероятность мутации Тип селекции Размерность задачи

1. Одноточечная 1. Сильная 1. Пропорциональная 1. 2

2. Двуточечная 2. Средняя 2. Турнирная 2. 3

3. Равномерная 3. Слабая 3. Ранговая 3. 4

4. Побитовое сравнение 4. Элитарная

5. Псевдо-митоз

i Надоели баннеры? Вы всегда можете отключить рекламу.