Секция ««Математические методы моделирования, управления и анализа данных»
УДК 519.87
ЭФФЕКТИВНОСТЬ МЕТОДОВ ИНТЕЛЛЕКТУАЛЬНОГО АНАЛИЗА ДАННЫХ ПРИ РАСПОЗНАВАНИИ ТИПА РАДАРНЫХ СИГНАЛОВ, ВОЗВРАЩАЕМЫХ
ОТ ИОНОСФЕРЫ
Я. С. Полонская Научный руководитель - Е. С. Семенкин
Сибирский государственный аэрокосмический университет имени академика М. Ф. Решетнева
Российская Федерация, 660037, г. Красноярск, просп. им. газ. «Красноярский рабочий», 31
Е-mail: yanapolonskaya [email protected]
Рассматривается решение задачи классификации радарных сигналов с использованием системы RapidMiner. Проводится сравнение эффективности методов классификации и выявляются наиболее эффективные из них.
Ключевые слова: ионосфера, радарные сигналы, классификация, нейронная сеть, метод опорных векторов, метод k-ближайших соседей, метод деревьев решений, индукция правил.
DATA MINING TECHNIQUES EFFECTIVENESS IN RECOGNIZING THE TYPE OF RADAR SIGNALS RETURNED FROM THE IONOSPHERE
Y. S. Polonskaya Scientific supervisor - E. S. Semenkin
Reshetnev Siberian State Aerospace University 31, Krasnoyarsky Rabochy Av., Krasnoyarsk, 660037, Russian Federation E-mail: [email protected]
The paper considers the classification of radar signals using RapidMiner system. The comparison of the classification methods effectiveness is conducted and selection of the best ща them is fulfilled.
Keywords: ionosphere, radar signals, classification, neural net, support vector machine, k-nearest neighbors, decision tree, rule induction.
Целью теоретических исследований ионосферы является детальное описание ее основных свойств и процессов, в ней протекающих. Решение этой проблемы позволит повысить надёжность работы навигационных систем дальней радиосвязи, обеспечения полётов космических аппаратов и т. д .
Основной причиной, определяющей интерес к изучению ионосферы Земли, является свойство ионосферы влиять на распространение радиоволн. Изучение этого влияния обусловлено растущими требованиями к качеству связи посредством ионосферных радиоканалов, точности позиционирования в системах спутниковой радионавигации, работе радиолокационных систем. Основной фактор, осложняющий учет влияния ионосферы на распространение радиоволн - это наличие в ионосфере неоднородностей и возмущений различной природы, в том числе и антропогенных, а также различных нестационарных процессов.
Задача, решаемая в данной работе, состоит в классификации высокочастотных радарных сигналов, возвращаемых из ионосферы.
Исходные данные, используемые в этом исследовании, были собраны радаром, управляемым университетом Джона Хопкинса (прикладная лаборатория физики). Данный радар работает в частотах от 8 до 20 МГц и состоит из 16 управляемых антенн. Для исследования были выбраны данные, зарегистрированные в 1986-1987 гг., когда у радара была более низкая выходная мощность, приводящая к несколько более зашумленным сигналам, что особенно подходит для демонстрации возможностей классификаторов [1-3]. База данных, используемая в данной работе, содержит 351 экземпляр и 34 атрибута.
Актуальные проблемы авиации и космонавтики - 2015. Том 1
Для проведения исследований были использованы следующие методы классификации: искусственные нейронные сети (ANN, [4]), метод опорных векторов (SVM, [5]), метод k-ближайших соседей (k-NN, [6]), метод деревьев решений (DT, [7]), индукция правил (RI, [8]). Для сравнения данных методов классификации использовалась система RapidMiner [9].
С помощью оператора T-Test проведено сравнение используемых методов, чтобы увидеть, имеется ли между ними статистически значимое различие. Данный оператор используется для сравнения производительности векторов, выполняя i-тест Стьюдента для определения вероятности нулевой гипотезы, то есть гипотезы о несущественном различии случайных величин.
Эффективность каждого метода (усредненная по 10 экспериментам доля правильно классифицированных событий и ее разброс), полученная описанным способом в ходе численных экспериментов с системой RapidMiner, а также результаты i-test представлены в таблице.
Эффективность различных методов в классификации сигналов радара
ANN DT SVM k-NN RI
0.909 +/- 0.043 0.929 +/- 0.046 0.864 +/- 0.055 0.869 +/- 0.044 0.889 +/- 0.059
ANN 0.345 0.065 0.065 0.401
DT 0.011 0.009 0.133
SVM 0.809 0.349
k-NN 0.420
Полученные результаты показывают, что на данной задаче большинство методов демонстрируют примерно одинаковую эффективность с небольшим различием, зачастую статистически незначимым. Поэтому можно утверждать, что методы интеллектуального анализа данных, реализованные в пакете RapidMiner, не позволяют построить достаточно эффективные системы распознавания типов сигналов радара (ошибка до 8 %), т. е. необходимо их модифицировать или даже разрабатывать и реализовывать более мощные интеллектуальные технологии анализа данных. Наиболее перспективным направлением в этой связи является разработка технологий автоматизированного проектирования классификаторов на нечеткой логике [10; 11], искусственных нейронных сетей [12; 13], а также других методов анализа данных, с применением самонастраивающихся адаптивных алгоритмов оптимизации и моделирования [14; 15] для выбора их эффективных структур и настройки параметров. Кроме того, перспективными являются также подходы автоматического формирования коллективов интеллектуальных информационных технологий [16; 17].
Библиографические ссылки
1. Ionosphere Data Set [Электронный ресурс]. URL: http://archive.ics.uci.edu/ml/datasets/ Ionosphere (дата обращения: 15.01.2015).
2. Neural networks for automated classification of ionospheric irregularities in HF radar backscattered signals / S. Wing, R. A. Greenwald, C.-I. Meng, V. G. Sigillito, and L. V. Hutton // Johns Hopkins University Applied Physics Laboratory, Laurel, Maryland, USA.
3. Ionosphere Data Set Description [Электронный ресурс]. URL: http://archive.ics.uci.edu/ ml/machine-learning-databases/ionosphere/ionosphere.names (дата обращения: 15.01.2015).
4. Haykin S. S. et al. Neural networks and learning machines. Upper Saddle River : Pearson Education, 2009. Т. 3.
5. Suykens J. A. K., Vandewalle J. Least squares support vector machine classifiers // Neural processing letters. 1999. Т. 9. №. 3. P. 293-300.
6. Soft k-nearest-neighbour classifiers / Bermejo, S. Cabestany, J. Adaptive // Pattern Recognition. 2000. Vol. 33. P. 1999-2005.
7. Quinlan J. R. Generating production rules from decision trees. In McDermott, John. Proceedings of the Tenth International Joint Conference on Artificial Intelligence (IJCAI-87). Milan, Italy. 1987. P. 304307.
8. Cohen W. W. Fast effective rule induction //Proceedings of the twelfth international conference on machine learning. 1995. С. 115-123.
9. RapidMiner [Электронный ресурс]. URL: https://rapidminer.com/ (дата обращения: 15.01.2015).
Секция «Математические методы моделирования, управления и анализа данных»
10. Semenkin, E., Stanovov, V. Fuzzy Rule Bases Automated Design with Self-configuring Evolutionary Algorithm // Informatics in Control, Automation and Robotics (ICINCO), 11th International Conference on. INSTICC, 2014. Vol. 1. P. 318-323.
11. Stanovov V., Semenkin E. Self-adjusted evolutionary algorithms based approach for automated design of fuzzy logic systems // Вестник СибГАУ. 2013. Вып. 4 (50). С. 148-152.
12. Brester K., Semenkin E. Development of adaptive genetic algorithms for neural network models multicriteria design // Вестник СибГАУ. 2013. Вып. 4 (50). С. 99-103.
13. Akhmedova Sh., Semenkin E. Co-operation of Biology Related Algorithms meta-heuristic in ANN-based classifiers design // Proceedings of the IEEE Congress on Evolutionary Computation 2014. P.867-872.
14. Ахмедова Ш. А., Семенкин Е. С. Новый коллективный метод оптимизации на основе кооперации бионических алгоритмов // Вестник СибГАУ. 2013. № 4(50). С. 92-99.
15. Семенкин Е. С., Семенкина М. Е. Применение генетического алгоритма с модифицированным оператором равномерной рекомбинации при автоматизированном формировании интеллектуальных информационных технологий // Вестник СибГАУ. 2007. № 3. С. 27-33.
16. Семенкин Е. С., Шабалов А. А., Ефимов С. Н. Автоматизированное проектирование коллективов интеллектуальных информационных технологий методом генетического программирования // Вестник СибГАУ. 2011. № 3. С. 77-81.
17. Semenkina M., Semenkin E. Classifier ensembles integration with self-configuring genetic programming algorithm // Lecture Notes in Computer Science. 2013. Т. 7824 LNCS. С. 60-69.
© Полонская Я. С., 2015