Научная статья на тему 'Методы интеллектуального анализа данных в задачах распознавания сигналов'

Методы интеллектуального анализа данных в задачах распознавания сигналов Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
144
35
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
РАДАРНЫЕ СИГНАЛЫ / RADAR SIGNALS / ГИДРОАКУСТИЧЕСКИЕ СИГНАЛЫ / SONAR SIGNALS / КЛАССИФИКАЦИЯ / CLASSIFICATION / ОПТИМИЗАЦИЯ / OPTIMIZATION / АНСАМБЛИ / ENSEMBLES

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Полонская Я. С.

Производится сравнение эффективности различных методов интеллектуального анализа данных в задачах классификации радарных и гидролокационных сигналов с использованием системы Rapid Miner.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

DATA MINING TECHNIQUES IN RECOGNIZING THE TYPE OF SIGNALS

Effectiveness comparison of different methods of data mining is fulfilled for the tasks of classification of radar signal types and sonar signals using Rapid Miner system.

Текст научной работы на тему «Методы интеллектуального анализа данных в задачах распознавания сигналов»

Математические методы моделирования, управления и анализа данных

системы терморегулирования космического аппарата // Вестник МАИ. 2015. Т. 22, № 2. С. 42-54.

References

1. Mosterman P., Biswas G. A theory of discontinuities in physical system models // Journal of the Franklin Institute, 1998. Vol. 335, no. 3, рр. 401-439.

2. Paynter H. Analysis and design of engineering systems // Cambridge, Mass., M.I.T. press, 1961. 303 p.

3. Petrov D. S. [Spacecraft propulsion system simulation using three-stage decomposition method] // Vestnik Moskovskogo Aviatsionnogo Instituta. 2014. Vol. 21, no. 1, рp. 43-57 (In Russ.).

4. Pavlov D. V., Petrov D. S. [Tuning of spacecraft propulsion system model using three stage decomposition method] // Vestnik "NPO im. S. A. Lavochkina". 2015. No. 1, рp. 80-87 (In Russ.).

5. Pavlov D. V., Petrov D. S. [Use of three-stage decomposition method for simulation of spacecraft thermal control subsystem]. Vestnik Moskovskogo Aviatsionnogo Instituta. 2015. Vol. 22, no. 2, pр. 42-54 (In Russ.).

© Петров Д. С., 2015

УДК 519.87

МЕТОДЫ ИНТЕЛЛЕКТУАЛЬНОГО АНАЛИЗА ДАННЫХ В ЗАДАЧАХ РАСПОЗНАВАНИЯ СИГНАЛОВ*

Я. С. Полонская

Сибирский государственный аэрокосмический университет имени академика М. Ф. Решетнева Российская Федерация, 660037, г. Красноярск, просп. им. газ. «Красноярский рабочий», 31

E-mail:[email protected]

Производится сравнение эффективности различных методов интеллектуального анализа данных в задачах классификации радарных и гидролокационных сигналов с использованием системы Rapid Miner.

Ключевые слова: радарные сигналы, гидроакустические сигналы, классификация, оптимизация, ансамбли.

DATA MINING TECHNIQUES IN RECOGNIZING THE TYPE OF SIGNALS

Ya. S. Polonskaya

Reshetnev Siberian State Aerospace University 31, Krasnoyarsky Rabochy Av., Krasnoyarsk, 660037, Russian Federation E-mail:[email protected]

Effectiveness comparison of different methods of data mining is fulfilled for the tasks of classification of radar signal types and sonar signals using Rapid Miner system.

Keywords: radar signals, sonar signals, classification, optimization, ensembles.

Для проведения исследований были использованы две базы данных. Первая из них соответствует задаче классификации высокочастотных радарных сигналов, возвращаемых из ионосферы. База данных содержит 351 экземпляр и 34 атрибута [1]. Вторая задача состоит в классификации гидроакустических сигналов. Сонары посылают звук высокой частоты в определенном направлении и получают отраженную звуковую волну, по ее характеристике можно судить, от чего данная звуковая волна отразилась. База данных о гидроакустических сигналах содержит 208 экземпляров и 60 атрибутов [2]. Задачи решались при помощи программной системы анализа данных RapidMinerStudio [3].

В качестве методов анализа данных для обоих наборов данных были выбраны следующие алгоритмы: искусственная нейронная сеть (ANN [4]), индукция

правил (RI [5]), метод k ближайших соседей (k-NN [6]), дерево решений (DT [7]), наивный байесовский классификатор (NB [8]), случайный лес (RF [9]), логистическая регрессия (LR [10]), метод опорных векторов (SVM [11]).

Для первого набора данных лучшие результаты показали DT - 92,88 % и ANN - 91,84 %. После оптимизации, которая улучшила показатели всех методов, лучший результат было получен нейронной сетью (ANN 98,21 %). Применение ансамблей привело к ухудшению результатов.

Для второго набора данных лучший результат показал NB 89,46 %. Оптимизация параметров также дала улучшение для всех методов, а лучший результат

* Работа выполнена в рамках проекта RFMEFI57414X0037.

Решетнеескцие чтения. 2015

продемонстрировала нейронная сеть ANN (93,94 %). Ансамбли обоих типов также не привели к улучшению результатов.

Таким образом, мы наблюдаем, что в обоих случаях из всех использованных подходов лучший результат показала оптимизированная по скорости обучения нейронная сеть. Можно сделать вывод, что задачи распознавания сигналов могут быть решены с помощью программной системы RapidMiner, что может облегчить работу многих организаций, выполняющих исследования в области идентификации сигналов. Использованные подходы к распознаванию сигнальной информации позволили решить конкретные задачи распознавания применительно к системам обработки гидроакустической и радарной сигнальной информации. Данные методы могут быть использованы для широкого круга прикладных задач, связанных с распознаванием сигналов разного рода, но риск при решении этих задач неизбежен.

В дальнейшем предполагается перейти от использования стандартных пакетов к применению более эффективных методов, основанных на специальных эволюционных алгоритмах [12; 13].

Библиографические ссылки

1. Ionosphere Data Set [Электронный ресурс]. URL: http://archive.ics.uci.edu/ml/datasets/Ionosphere (дата обращения: 5.09.2015).

2. Connectionist Bench (Sonar, Mines vs. Rocks) Data Set [Электронный ресурс]. URL: https://archive. ics.uci.edu/ml/datasets/Connectionist+Bench+(Sonar%2C +Mines+vs.+Rocks) (дата обращения: 6.09.2015).

3. RapidMiner [Электронный ресурс]. URL: https://rapidminer.com/ (дата обращения: 6.09.2015).

4. Girosi F., Jones M., Poggio T. Regularization theory and neural network architecture // Neural Computation. 1995. Vol. 7, рp. 219-270.

5. Cohen W. W. Fast effective rule induction // Proceedings of the twelfth international conference on machine learning. 1995. С. 115-123.

6. Bermejo S., Cabestany J. Adaptive Soft k-nearest-neighbour classifiers // Pattern Recognition. 2000. Vol. 33. Pp. 1999-2005.

7. Quinlan J. R. Generating production rules from decision trees // Proceedings of the Tenth International Joint Conference on Artificial Intelligence (IJCAI-87) / McDermott, John. Milan, 1987. Pp. 304-307.

8. Langley P., Iba W., & Thompson K. An analysis of Bayesian classifiers // Proceedings of the Tenth National Conference on Artificial Intelligence. San Jose, CA : AAAI, 1992. Pp. 223-228.

9. Antipov E. A., Pokryshevskaya E. B. Mass appraisal of residential apartments: An application of Random forest for valuation and a CART-based approach for model diagnostic // Expert Systems with Applications. 2012. Vol. 39, no. 2, рр. 1772-1778.

10. Chao-YingJoann Peng; Kuk Lida Lee; Gary M Ingersoll. An introduction to logistic regression analysis and reporting // J. of Educational Research. 2002. No. 96(1), pp. 3-13.

11. Durgesh K. Srivastava, Lekha Bhambhu. Data classification using support vector Machine // J. of

theoretical and applied information technology. 2009. Рp. 67-74.

12. Бежитский С. С., Семенкин Е. С., Семенки-на О. Э. Гибридный эволюционный алгоритм для задач выбора эффективных вариантов систем управления // Автоматизация. Современные технологии. 2005. № 11. С. 24.

13. Семенкин Е. С., Семенкина М. Е. Применение генетического алгоритма с модифицированным оператором равномерной рекомбинации при автоматизированном формировании интеллектуальных информационных технологий // Вестник СибГАУ. 2007. № 3(16). С. 27-33.

References

1. Ionosphere Data Set [Electronic resourse]. URL: http://archive.ics.uci.edu/ml/datasets/Ionosphere (date of the application: 5.09.2015).

2. Connectionist Bench (Sonar, Mines vs. Rocks) Data Set [Electronic resourse]. URL: https://archive.ics. uci.edu/ml/datasets/Connectionist+Bench+(Sonar%2C+M ines+vs.+Rocks) (date of the application: 6.09.2015).

3. RapidMiner [e-course] [Electronic resourse]. URL: https://rapidminer.com/ (date of the application: 6.09.2015).

4. Girosi F., Jones M., Poggio T. Regularization theory and neural network architecture // Neural Computation. 1995. Vol. 7. Рp. 219-270.

5. Cohen W. W. Fast effective rule induction // Proceedings of the twelfth international conference on machine learning. 1995. С. 115-123.

6. Adaptive. Soft k-nearest-neighbour classifiers / S. Bermejo, J. Cabestany // Pattern Recognition. 2000. Vol. 33, pp. 1999-2005.

7. Quinlan, J. R. Generating production rules from decision trees. In McDermott, John. Proceedings of the Tenth International Joint Conference on Artificial Intelligence (IJCAI-87). Milan, Italy. 1987. Pp. 304-307.

8. An analysis of Bayesian classifiers / Langley P., Iba W., & Thompson K. // Proceedings of the Tenth National Conference on Artificial Intelligence. 1992. Pp. 223-228. San Jose, CA: AAAI.

9. Antipov E. A., Pokryshevskaya E. B. Mass appraisal of residential apartments: An application of Random forest for valuation and a CART-based approach for model diagnostic // Expert Systems with Applications. 2012. Vol. 39, no. 2, рр. 1772-1778.

10. An introduction to logistic regression analysis and reporting / Peng, Chao-YingJoann; Lee, Kuk Lida; Ingersoll, GaryM // J. of Educational Research 96(1). 2002. Pp. 3-13.

11. Data classification using support vector Machine Durgesh K. Srivastava,Lekha Bhambhu Journal of theoretical and applied information technology. 2009. Fp. 67-74.

12. Bezhitskiy S. S., Semenkin E. S., Semenkina O. E. Hybrid evolutionary algorithms for the choice of effective variants of control systems // Avtomatizatsiya. Sovremennye technologii. 2005. № 11. P. 24.

13. Semenkin E. S., Semenkina M. E. Application of genetic programming algorithm with modified uniform crossover operator for automated design of intelligent information technologies // Vestnik SibSAU. 2007. No. 3(16), рp. 27-33.

© Полонская Я. С., 2015

i Надоели баннеры? Вы всегда можете отключить рекламу.