Секция ««Математические методы моделирования, управления и анализа данных»
УДК 519.87
О ВЫБОРЕ ЭФФЕКТИВНЫХ НАСТРОЕК ГЕНЕТИЧЕСКОГО АЛГОРИТМА ОПТИМИЗАЦИИ ПАРАМЕТРОВ КЛАССИФИКАТОРОВ В ЗАДАЧЕ РАСПОЗНАВАНИЯ ТИПА РАДАРНЫХ СИГНАЛОВ, ВОЗВРАЩАЕМЫХ ОТ ИОНОСФЕРЫ
С НАЛИЧИЕМ ПОМЕХ
Я. С. Полонская
Сибирский государственный аэрокосмический университет имени академика М. Ф. Решетнева
Российская Федерация, 660037, г. Красноярск, просп. им. газ. «Красноярский рабочий», 31
Е-mail: yanapolonskaya [email protected]
Рассматривается решение задачи классификации радарных сигналов при помощи классификаторов в системе RapidMiner, настраиваемых генетическим алгоритмом оптимизации. Проводится сравнение эффективности методов классификации без оптимизации и с оптимизацией.
Ключевые слова: ионосфера, радарные сигналы, классификация, оптимизация, генетический алгоритм
ON THE CHOICE OF EFFICIENT SETTINGS FOR THE GENETIC ALGORITHM OF CLASSIFIERS PARAMETERS OPTIMIZATION IN THE TASK RECOGNITION OF TYPE OF THE RADAR SIGNALS RETURNED FROM THE IONOSPHERE WITH EXISTENCE
OF HINDRANCES
Y. S. Polonskaya
Reshetnev Siberian State Aerospace University 31, Krasnoyarsky Rabochy Av., Krasnoyarsk, 660037, Russian Federation E-mail: [email protected]
Problem of radar's signals classification by means of the RapidMiner system classifiers tuned with genetic algorithm of optimization is considered. Comparison of classification methods efficiency with optimization and without optimization is carried out.
Keywords: ionosphere, radar signals, classification, optimization, genetic algorithm
Большой круг задач связан с распознаванием сигналов, являющихся носителем информации о состоянии объектов или процессов. Но эти сигналы, часто имеют сложную структуру и искажены влиянием случайных составляющих, помех. Шумы, как собственно и сигналы, имеют стохастический характер. Принятый сигнал является смесью переданного сигнала и помехи. Для анализа таких сигналов требуется использовать методы, позволяющие выявить их характерные особенности.
C помощью современных методов обработки сигналов мы имеем возможность эффективно извлекать полезную информацию из принятого сигнала об источнике или среде распространения сигналов различной природы. Обработка сигналов - это инструмент, жизненно необходимый для работы многих организаций, что доказывает их повседневное использование и широчайшее распространение во множестве стран мира.
Целью теоретических исследований ионосферы является детальное описание ее основных свойств и процессов, в ней протекающих. Решение этой проблемы позволит повысить надёжность работы навигационных систем дальней радиосвязи, обеспечения полётов космических аппаратов и т. д .
Задача, решаемая в данной работе, состоит в классификации высокочастотных радарных сигналов, возвращаемых из ионосферы.
Исходные данные, были собраны радаром, управляемым университетом Джонса Хопкинса. Для исследования были выбраны данные, зарегистрированные в 1986-1987, когда у радара была более низкая выходная мощность, приводящая к несколько более зашумленным сигналам, что особенно
Актуальные проблемы авиации и космонавтики - 2016. Том 1
подходит для демонстрации возможностей классификаторов [1]. База данных, содержит 351 экземпляр и 34 атрибута. Задачи решались при помощи программной системы анализа данных RapidMiner Studio [2].
Для проведения исследований были использованы следующие алгоритмы: искусственная нейронная сеть (ANN [3]), индукция правил (RI [4]), метод k-ближайших соседей (k-NN [5]), дерево решений (DT [6]), наивный Байесовский классификатор (NB [7]), случайный лес (RF [8]), логистическая регрессия (LR [9]), метод опорных векторов (SVM [10]). Результаты были получены недостаточно удовлетворительные [11], поэтому было решено оптимизировать используемые в данной работе методы при помощи генетического алгоритма [12]. Так как эффективность генетического алгоритма существенно зависит от выбора его настроек и параметров [13], решено было выбирать настройки генетического алгоритма заранее, используя собственную программную реализацию. Для выбора настроек генетического алгоритма он был реализован на языке С++ в среде Microsoft Visual Studio 2010 и протестирован на функциях Шекеля, Растригина и полиноме второго порядка. Для каждой комбинации настроек было проведено 100 запусков алгоритма. В результате были выбрана лучшая комбинация настроек генетического алгоритма: турнирная селекция с размером турнира 9, средняя мутация, двухточечное скрещивание, вероятность скрещивания: 0,95.
С помощью оператора T-Test проведено сравнение используемых методов без оптимизации и с оптимизацией, чтобы увидеть, имеется ли между ними статистически значимое различие.
Эффективность оптимизированных и неоптимизированных методов представлена в таблице.
Эффективность оптимизированных и неоптимизированных методов классификации
Метод классификации Без оптимизации С оптимизацией
SVM 80.07 % +/- 4.34 % 81.48 % +/- 3.87 %
DT 92.60 % +/- 3.17 % 91.72 % +/- 3.73 %
k-NN 86.03 % +/- 7.18 % 86.33 % +/- 3.56 %
RI 88.02 % +/- 3.60 % 89.17 % +/- 6.24 %
ANN 90.88 % +/- 4.00 % 90.04 % +/- 4.05 %
LR 87.72 % +/- 4.81 % 88.04 % +/- 4.90 %
RF 80.34 % +/- 6.82 % 79.76 % +/- 10.43 %
После сравнения каждого неоптимизированного метода с оптимизированным, было выявлено, что оптимизация не принесла значимого улучшения ни для одного метода, и в некоторых случаях даже ухудшила результат.
Таким образом, из полученных результатов можно сделать вывод, что нельзя применять одни и те же настройки для тестовых и реальных задач. Если причиной этого является нерепрезентативность множества тестовых функций, то необходимо расширять множество тестовых задач за счет использования моделей реальных сложных систем [14; 15]. Вторым подходом является использование алгоритмов оптимизации, автоматически подстраивающихся под решаемую задачу [16].
Библиографические ссылки
1. Ionosphere Data Set [Электронный ресурс]. URL: http://archive.ics.uci.edu/ml/datasets/ Ionosphere (дата обращения: 15.04.2016).
2. RapidMiner [Электронный ресурс]. URL: https://rapidminer.com/ (дата обращения: 15.04.2016).
3. Haykin S. S. et al. Neural networks and learning machines. Upper Saddle River : Pearson Education, 2009. Т. 3.
4. Cohen W. W. Fast effective rule induction //Proceedings of the twelfth international conference on machine learning. 1995. С. 115-123.
5. Soft k-nearest-neighbour classifiers / Bermejo, S. Cabestany, J. Adaptive // Pattern Recognition. 2000. Vol. 33. Pp. 1999-2005.
6. Quinlan J. R. Generating production rules from decision trees. In McDermott, John. Proceedings of the Tenth International Joint Conference on Artificial Intelligence (IJCAI-87). Milan, Italy. 1987. Pp.304-307.
7. Langley P., Iba W., Thompson K. An analysis of Bayesian classifiers // Proceedings of the Tenth National Conference on Artificial Intelligence. San Jose, CA: AAAI. 1992. Pp. 223-228.
Секция «Математические методы моделирования, управления и анализа данных»
8. Antipov E. A., Pokryshevskaya E. B. Mass appraisal of residential apartments: An application of Random forest for valuation and a CART-based approach for model diagnostic // Expert Systems with Applications. 2012. Vol. 39. No. 2. P. 1772-1778.
9. An introduction to logistic regression analysis and reporting / Peng, Chao-YingJoann; Lee, Kuk Lida; Ingersoll, GaryM // J. of Educational Research. 2002. 96(1). Pp. 3-13.
10. Data classification using support vector Machine Durgesh K. Srivastava, Lekha Bhambhu // J. of theoretical and applied information technology. 2009. Рp. 67-74.
11. Полонская Я. С. Методы интеллектуального анализа данных в задачах распознавания сигналов // Решетневские чтения : материалы XIX Междунар. науч.-практ. конф., посвящ. 55-летию Сиб. гос. аэрокосмич. ун-та им. акад. М. Ф. Решетнева (10-14 ноября 2015 г.). 2015. Т. 2. С. 81-82.
12. Об эволюционных алгоритмах решения сложных задач оптимизации / А. В. Гуменникова, М. Н., Емельянова Е. С. Семенкин, Е. А. Сопов // Вестник СибГАУ. 2003. № 4. С. 14.
13. Бежитский С. С., Семенкин Е. С., Семенкина О. Э. Гибридный эволюционный алгоритм для задач выбора эффективных вариантов систем управления // Автоматизация. Современные технологии. 2005. № 11. С. 24.
14. Медведев А. В., Победаш П. Н., Семенкин Е. С. Математическая модель глобального социально-экономического развития // Вестник СибГАУ. 2010. № 5(31). С. 137-142.
15. Семенкин Е. С., Клешков В. М. Модели и алгоритмы распределения общих ресурсов при управлении инновациями реструктурированного машиностроительного предприятия // Проблемы машиностроения и автоматизации. 2006. № 3. С. 24-30.
16. Brester C., Semenkin E., Sidorov M., Minker W. Self-adaptive multi-objective genetic algorithms for feature selection // OPT-i 2014 - 1st International Conference on Engineering and Applied Sciences Optimization, Proceedings 1. 2014. С. 1838-1846.
© Полонская Я. С., 2016