Научная статья на тему 'Применение распределенного самоконфигурируемого алгоритма генетического программирования для решения задач классификации'

Применение распределенного самоконфигурируемого алгоритма генетического программирования для решения задач классификации Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
101
39
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Хритоненко Д. И., Семенкин Е. С.

Рассматривается подход распараллеливания самоконфигурируемого алгоритма генетического программирования при решении задач классификации. Предложенный подход тестируется на ряде задач и сравнивается с базовой, не распараллеленной, версией. Эффективность полученной в итоге программной системы сравнивается с известными аналогами на задачах классификации.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Применение распределенного самоконфигурируемого алгоритма генетического программирования для решения задач классификации»

Актуальные проблемы авиации и космонавтики. Информационные технологии

При проведении вычислительных экспериментов показано, что качество полученной модели довольно хорошее. На основании данной модели построен непараметрический регулятор, обеспечивающий на выходе объекта траекторию, близкую к желаемой. Проиллюстрировано, как влияют помехи и величина шага дискретизации на получаемые результаты моделирования и управления. Описанные методы предпочтительны в использовании, когда исследователь не располагает достаточной информацией для построения параметрической модели, что довольно актуально при работе с реальными системами.

Библиографические ссылки

1. Medvedev A. V. Identification and control for linear dynamic systems of unknown order. // Optimization Techniques IFIP Technical Conference / Berlin -Heidelderg - New-York: Springer - Verlag, 1975. C. 48-55.

2. Медведев А. В. Непараметрические системы адаптации. Новосибирск : Наука. 1983.

© Старовойтова А. В., 2013

УДК 519.87

Д. И. Хритоненко Научный руководитель - Е. С. Семенкин Сибирский государственный аэрокосмический университет имени академика М. Ф. Решетнева, Красноярск

ПРИМЕНЕНИЕ РАСПРЕДЕЛЕННОГО САМОКОНФИГУРИРУЕМОГО АЛГОРИТМА ГЕНЕТИЧЕСКОГО ПРОГРАММИРОВАНИЯ ДЛЯ РЕШЕНИЯ ЗАДАЧ КЛАССИФИКАЦИИ

Рассматривается подход распараллеливания самоконфигурируемого алгоритма генетического программирования при решении задач классификации. Предложенный подход тестируется на ряде задач и сравнивается с базовой, не распараллеленной, версией. Эффективность полученной в итоге программной системы сравнивается с известными аналогами на задачах классификации.

На сегодняшний день широко распространены различные многопроцессорные вычислительные системы. Перенос приложений под такие системы может значительно увеличить эффективность их работы. Однако, не всегда ясно каким образом производить распараллеливание и каким образом оно повлияет на эффективность того или иного алгоритма. Один из основных путей распараллеливания - распараллеливание алгоритма на уровне приложения. Основная идея подхода: все вычисления равномерно распределяются по существующим логическим ядрам.

Эволюционные алгоритмы (ЭА), а в частности алгоритм генетического программирования (ГП) [1], являются стохастическими алгоритмами. Важной особенностью ЭА является то, что их эффективность зависит от используемого датчика случайных чисел. При распараллеливании на уровне приложения была выявлена следующая проблема: эффективность алгоритмов на тестовых задачах [2] падала с увеличением числа задействованных логических ядер. Как показа-

ли исследования, вычислительные системы в состоянии генерировать лишь псевдослучайные последовательности чисел. Кроме того, в случае генерирования последовательностей псевдослучайных чисел различными потоками, они зачастую оказываются либо одинаковыми, либо сдвинутыми на некоторое число элементов. В связи с этим предлагается следующий метод параллелизации, в котором один из потоков (под номером п) будет отвечать за генерацию псевдослучайных чисел (см. рисунок).

Самоконфигурируемый алгоритм ГП был реализован в виде программной системы (вР). Эффективность была проверена на задачах классификации [3].

Для проверки эффективности алгоритма было проведено десять стократных прогонов. По критерию Манна-Уитни-Уилкоксона с доверительной вероятностью 0.95 алгоритм вР является неразличимым со своей распараллеленной версией. Ниже представлены усредненные результаты работы алгоритма (см. таблицу).

Секция ««Математические методы моделирования, управления и анализа данных»

Результаты тестирования

Название Australian German Название Australian German

алгоритма credit credit алгоритма credit credit

SCGP 0.9022 0.7950 Boosting 0,7600 0,7000

MGP 0.8985 0.7875 Bagging 0,8470 0,6840

2SGP 0.9027 0.8015 RSM 0,8520 0,6770

GP 0.8889 0.7834 CCEL 0,8660 0,7460

C4.5 0.8986 0.7773 CART 0.8744 0.7565

LR 0.8696 0.7837 MLP 0.8986 0.7618

k-NN 0.7150 0.7151 GP 0.8960 0.7693

Из приведенных выше результатов видно, что предложенный подход решения задачи сравним с представленными аналогами, известными из научной литературы [4].

Число потоков

Рис. 3. Время работы алгоритма

Кроме того, важным является тот результат, что при неизменной эффективности время работы было уменьшено (приблизительно в 1.6 раза). Нелинейное увеличение быстродействия вычислительной системы объясняется сложностью её устройства. Зависимость

времени работы от числа потоков представлена на графике ниже:

Таким образом, был разработан и программно реализован распараллеленный самоконфигурируемый алгоритм генетического программирования. Представленная схема распараллеливания позволяет без снижения эффективности увеличивать скорость работы программной системы, что является важным при работе со сложными вычислениями.

Библиографические ссылки

1. Рутковская Д., Пилиньский М., Рутковский Л. Нейронные сети, генетические алгоритмы и нечеткие системы : пер. с польск. И. Д. Рудинского. М. : Горячая линия. Телеком, 2006. 383 с.

2. URL: http://coco.gforge.inria.fr/doku.php.

3. URL: http://archive.ics.uci.edu/ml/datasets.html.

4. Semenkin E., Semenkina M. Self-Configuring Genetic Programming Algorithm with Modified Uniform Crossover // Proc. of IEEE Congress on Evolutionary Computation. IEEE World Congress on Computational Intelligence, Brisbane, Australia, 2012.

© Хритоненко Д. И., 2013

УДК 519.8

Л. К. Ярлыкова Научный руководитель - А. В. Медведев Сибирский государственный аэрокосмический университет имени академика М. Ф. Решетнева, Красноярск

О НЕПАРАМЕТРИЧЕСКИХ АЛГОРИТМАХ СГЛАЖИВАНИЯ ПРИ МОДЕЛИРОВАНИИ

ЛАВИНООБРАЗНЫХ ПРОЦЕССОВ

Рассматривается моделирование лавинообразных процессов, с помощью непараметрических алгоритмов. В ходе исследований проводились наблюдения за некоторым процессом, в условиях непараметрической неопределенности. Представлены результаты численных исследований.

Современный человек все чаще сталкивается с различными природными катаклизмами, катастрофами в технических процессах, а также катастрофами в экономической, социальных сферах жизни. Именно поэтому важно изучать процессы, которые ведут себя скачкообразно и на первый взгляд непредсказуемо.

В математике с 70-х годов прошлого столетия начало развиваться новое направление- теория катастроф. Теория катастроф родилась на стыке двух дисциплин -

топологии и математического анализа, ее источниками являются теория особенностей гладких отображений Х. Уитни и теория устойчивости и бифуркаций динамических систем А. Пуанкаре, А. М. Ляпунова и А. А. Андронова. Оба эти направления слились, благодаря усилиям французского математика Р. Тома в единую теорию [1].

В качестве исследований большой интерес представляют лавинообразные процессы. Их объединяет с

i Надоели баннеры? Вы всегда можете отключить рекламу.