Научная статья на тему 'Архитектура программной системы для решения задач классификации с автоматическим извлечением информативных признаков многокритериальным генетическим алгоритмом'

Архитектура программной системы для решения задач классификации с автоматическим извлечением информативных признаков многокритериальным генетическим алгоритмом Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
69
22
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
МНОГОКРИТЕРИАЛЬНЫЙ ГЕНЕТИЧЕСКИЙ АЛГОРИТМ / MULTI-OBJECTIVE GENETIC ALGORITHM / ОТБОР ИНФОРМАТИВНЫХ ПРИЗНАКОВ / INFORMATIVE FEATURE SELECTION / КЛАССИФИКАТОР / CLASSIFIER

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Брестер К. Ю.

Описывается возможная архитектура системы для решения классификационных задач с привлечением многокритериального генетического алгоритма для отбора информативных признаков из базы данных. Указаны преимущества разрабатываемых технологий.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Брестер К. Ю.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

THE ARCHITECTURE OF THE SOFTWARE SYSTEM FOR SOLVING CLASSIFICATION PROBLEMS WITH AUTOMATIC FEATURE SELECTION VIA MULTI-OBJECTIVE GENETIC ALGORITHM

The possible software system architecture for solving classification problems with automatic feature selection from the database via multi-criteria genetic algorithm is described. Advantages of realized techniques are introduced.

Текст научной работы на тему «Архитектура программной системы для решения задач классификации с автоматическим извлечением информативных признаков многокритериальным генетическим алгоритмом»

библиотеки АРо^е. Каждый кадр берется и помещается на элемент рюШгеВох с помощью функции NewFrame.

3. Предварительная обработка видеокадров. Текущий кадр переводится в цветовую модель УИУ для получения значения компоненты яркости [1], которая необходима для дальнейшего анализа.

4. Вычисление центра каждого парковочного места. Информация о центре парковочного места необходима для определения, присутствует объект в данном месте или нет.

5. Относительно каждого потенциального места положения (/1, /2) определяются размеры и ориентация объекта в соответствии с правилом:

(М2)> w(îi,Î2)

Ф(М2)) = argmaxy(Г(М2,;,w^. (1)

/, w.

6. Проверка гипотезы. Для проверки используется выражение:

Г рт, гипотеза принята, у (Г(?1, /2,1, у, ф)) = Г" Р (2)

[0, гипотеза отклонена.

На основании значений поля достоверностей гипотез у(Г^ I ф)) определяются такие местоположения объектов, которые не образуют конкурирующих гипотез. Для этого используется алгоритм «последовательного присоединения»: к текущему набору найденных местоположений автомобилей добавляется новое

местоположение П* = /2,l(í1,í2),w(í1,í2),Ф(/1,/2)) , которое, не создавая пересечений с областями уже найденных объектов, максимизирует величину достоверности у(ГП*). Расстановка объектов производится до тех пор, пока существуют гипотезы с дос-товерностями, выше экспериментально подобранного порога.

Таким образом, задача размещения автомобилей на автопарковке решается методом от противного,

т. е. для того, чтобы обнаружить свободные места на автопарковке, используется метод обнаружения автомобилей на основе гипотезы, тем самым места, где не были обнаружены автомобили, и будут пустыми. Метод обнаружения автомобилей на основе гипотезы довольно прост и экономит время вычислений за счет использования минимального количество параметров, на основе которых происходит построение гипотез.

Интерфейс и основные функции программного продукта разрабатываются в среде разработки приложений Microsoft Visual Studio 2012, так как она обеспечивает быструю разработку и высокую скорость работы разрабатываемого приложения.

Система размещения автомобилей на автопарковке позволит рационально организовывать транспортный поток, легко осуществлять учет транспорта, сводить к минимуму материальные потери, эффективно использовать объем пространства, гарантированно обеспечить безопасность автомобиля и предоставить максимум удобств для общества.

Библиографические ссылки

1. Гашников М. В., Глумов Н. И., Ильясова Н. И. Методы компьютерной обработки изображений. М., 2003, 784 с.

2. Гаганов В., Конушин А. Сегментация движущихся объектов в видео потоке [Электронный ресурс]. URL: http://cgm.graphicon.ru (дата обращения: 14.09.2013).

References

1. Gashnikov M. V., Glumov N. I., Ilyasova N. I. Methods of computer Imaging. Moscow, 2003, 784 p.

2. Gaganov V., Konushin A. Segmentation of moving objects in video flow. Available at: http://cgm.graphicon.ru.

© Болдырев К. М., Лаптева М. А., 2014

УДК 519.87

АРХИТЕКТУРА ПРОГРАММНОЙ СИСТЕМЫ ДЛЯ РЕШЕНИЯ ЗАДАЧ КЛАССИФИКАЦИИ С АВТОМАТИЧЕСКИМ ИЗВЛЕЧЕНИЕМ ИНФОРМАТИВНЫХ ПРИЗНАКОВ МНОГОКРИТЕРИАЛЬНЫМ ГЕНЕТИЧЕСКИМ АЛГОРИТМОМ

К. Ю. Брестер

Сибирский государственный аэрокосмический университет имени академика М. Ф. Решетнева Российская Федерация, 660014, г. Красноярск, просп. им. газ. «Красноярский рабочий», 31

Е-таП: abahachy@mail.ru

Описывается возможная архитектура системы для решения классификационных задач с привлечением многокритериального генетического алгоритма для отбора информативных признаков из базы данных. Указаны преимущества разрабатываемых технологий.

Ключевые слова: многокритериальный генетический алгоритм, отбор информативных признаков, классификатор.

Решетневскуе чтения. 2014

THE ARCHITECTURE OF THE SOFTWARE SYSTEM FOR SOLVING CLASSIFICATION PROBLEMS WITH AUTOMATIC FEATURE SELECTION VIA MULTI-OBJECTIVE GENETIC ALGORITHM

C. Yu. Brester

Siberian State Aerospace University named after academician M. F. Reshetnev 31, Krasnoyarsky Rabochy Av., Krasnoyarsk, 660014, Russian Federation E-mail: abahachy@mail.ru

The possible software system architecture for solving classification problems with automatic feature selection from the database via multi-criteria genetic algorithm is described. Advantages of realized techniques are introduced.

Keywords: multi-objective genetic algorithm, informative feature selection, classifier.

Несмотря на то, что существующие программные пакеты предлагают разнообразие методов снижения размерности, в большинстве случаев они являются стандартными реализациями давно известного факторного анализа и метода главных компонент. Как показывают эксперименты [1], в ряде случаев данные подходы не демонстрируют эффективности, поэтому приходится использовать нестандартные методы, основанные на применении эвристических подходов (например, одно- и многокритериальные генетические алгоритмы). Успешные применения стохастических методов к задаче определения информативных признаков описаны в работах [2-5]. Кроме того, были проведены численные эксперименты, подтверждающие превосходство многокритериального генетического алгоритма над однокритериальным в рамках обсуждаемой задачи [6].

Целесообразность применения генетического алгоритма (ГА) к задаче определения информативных признаков объясняется рядом причин. Во-первых, это интуитивно понятное кодирование: 1 - атрибут должен быть выбрать из базы данных, 0 - признак не является информативным. Во-вторых, с помощью ГА можно оптимизировать одновременно как дискретные целевые функции, так и непрерывные.

Архитектура программной системы для решения классификационных задач с автоматическим извлечением информативных признаков многокритериальным ГА включает в себя три основных компонента:

1. ГА, оперирующий критериями, которые отражают релевантность сокращенного набора признаков. В работе [7] представлены возможные варианты таких целевых функций. Кроме того, в качестве критерия качества может применяться относительная точность (или ошибка), получаемая классификатором на рассматриваемой совокупности признаков.

2. Блок, отвечающий за выбор финального набора атрибутов из базы данных. Хорошо известно, что результатом работы многокритериальных ГА, основанных на идее Парето-доминирования, является множество несравнимых между собой точек. Для выбора финального решения из множества потенциальных наборов признаков может использоваться валидаци-онная выборка: классификационная модель обучается на наборах признаков, составляющих множество Па-рето; финальное решение определяется как совокупность атрибутов, использование которых для обуче-

ния классификатора позволило получить наименьшую ошибку (или наибольшую точность) на валидационной выборке. Такой подход был использован в работе [1].

Однако было замечено, что зачастую признаки, обеспечивающие минимум ошибки классификации на валидационной выборке, не демонстрируют наилучшего результата на тестовых примерах. Поэтому был предложен альтернативный подход: из финального множества несравнимых кандидатов-решений не выбирается одно конкретное; вместо этого все потенциальные наборы признаков участвуют в обучении классификаторов. Таким образом, получаем некоторую совокупность моделей, каждая из которых строится с привлечением конкретной подсистемы атрибутов. Решение о принадлежности объекта к тому или иному классу выносится на основе процедуры голосования обученных классификаторов с учетом правила большинства. Реализация данного подхода использовалась при проведении экспериментов, описанных в [6].

3. Классификатор. Существующие программные пакеты, такие как RapidMiner, Weka, содержат большое количество реализаций стандартных алгоритмов обучения. Главным достоинством указанных систем является простота интеграции. Однако для получения более точных результатов могут быть использованы эффективные алгоритмы генерирования классификаторов, описанные в работах [8; 9].

Работоспособность программной системы указанной архитектуры и эффективность реализованных алгоритмов, на которых базируется функционирование отдельных модулей, были исследованы на множестве задач распознавания эмоций человека по речи [6]. Полученные результаты демонстрируют высокое качество получаемых решений.

Библиографические ссылки

1. Sidorov M., Brester C., Minker W., Semenkin E. Speech-Based Emotion Recognition: Feature Selection by Self-Adapted Multi-Criteria Genetic Algorithm // Proceedings of the 9th edition of the Language Resources and Evaluation Conference. Reykjavik, Iceland, 2014.

2. Yang J. and Hanovar V. Feature subset selection using a genetic algorithm // Journal of IEEE Intelligent Systems. 1998. Vol. 13. P. 44-49.

3. Zhuo L., Zheng J., Wang F., Li X., Ai B., Qian J. A genetic algorithm based wrapper feature selection method for classification of hyperspectral images using

support vector machine // The International Archives of the Photogrammetry, Remote Sensing and Spatial Information Sciences. 2008. Vol. XXXVII. Part B7. P. 397-402.

4. Lanzi PL. Fast feature selection with genetic algorithms: a filter approach // IEEE International Conference on Evolutionary Computation. 1997. P. 537-540.

5. Hamdani T. M., Won J., Alimi A. M., Karray F. Multi-objective feature selection with NSGA II // Adaptive and Natural Computing Algorithms Lecture Notes in Computer Science. 2007. Vol. 4431. P. 240-247.

6. Sidorov M., Brester C., Semenkin E., Minker W. Speaker State Recognition with Neural Network-based Classification and Self-adaptive Heuristic Feature Selection // Proceedings of the 11th Intern. Conf. on Informatics in Control, Automation and Robotics (ICINC0'2014). 2014 . Vol. 1. P. 699-703.

7. Venkatadri M., Srinivasa Rao K. A multiobjective genetic algorithm for feature selection in data mining // International Journal of Computer Science and Information Technologies. 2010. Vol. 1, no. 5. P. 443-448.

8. Akhmedova Sh., Semenkin E. Co-Operation of Biology Related Algorithms Meta-Heuristic in ANN-Based Classifiers Design // Proceedings of the World Congress on Computational Intelligence (WCCI'14). 2014.

9. Семенкин Е. С., Шабалов А. А., Ефимов С. Н. Автоматизированное проектирование коллективов интеллектуальных информационных технологий методом генетического программирования // Вестник СибГАУ. 2011. № 3 С. 77-81.

References

1. Sidorov M., Brester C., Minker W., Semenkin E. Speech-Based Emotion Recognition: Feature Selection by Self-Adapted Multi-Criteria Genetic Algorithm // Proceedings of the 9th edition of the Language Resources and Evaluation Conference, Reykjavik, Iceland, 2014.

2. Yang J. and Hanovar V. Feature subset selection using a genetic algorithm. Journal of IEEE Intelligent Systems, vol. 13, 1998, p. 44-49.

3. Zhuo L., Zheng J., Wang F., Li X., Ai B., Qian J. A genetic algorithm based wrapper feature selection method for classification of hyperspectral images using support vector machine. The International Archives of the Photogrammetry, Remote Sensing and Spatial Information Sciences, vol. XXXVII, part B7, 2008, p. 397-402.

4. Lanzi PL. Fast feature selection with genetic algorithms: a filter approach. IEEE International Conference on Evolutionary Computation, 1997, p. 537-540.

5. Hamdani T. M., Won J., Alimi A. M., Karray F. Multi - objective feature selection with NSGA II. In Adaptive and Natural Computing Algorithms Lecture Notes in Computer Science, vol. 4431, 2007, p. 240-247.

6. Sidorov M., Brester C., Semenkin E., Minker W. Speaker State Recognition with Neural Network-based Classification and Self-adaptive Heuristic Feature Selection // Proceedings of the 11th International Conference on Informatics in Control, Automation and Robotics (ICINC0'2014). 2014, vol. 1, p. 699-703.

7. Venkatadri M., Srinivasa Rao K. A multiobjective genetic algorithm for feature selection in data mining. International Journal of Computer Science and Information Technologies, vol. 1, no. 5, 2010, p. 443-448.

8. Akhmedova Sh., Semenkin E. Co-Operation of Biology Related Algorithms Meta-Heuristic in ANN-Based Classifiers Design // Proceedings of the World Congress on Computational Intelligence (WCCI'14). -2014.

9. Semenkin E.S., Shabalov A.A., Efimov S.N. Automated design of intelligent information technology collectives by means of genetic programming technique //

VestnikSibGAU. 2011, № 3, p. 77-81.

© Epecrep K. to., 2014

УДК 539.26:519.65:519.68

ЭВОЛЮЦИОННОЕ МУЛЬТИПОПУЛЯЦИОННОЕ МОДЕЛИРОВАНИЕ АТОМНОЙ КРИСТАЛЛИЧЕСКОЙ СТРУКТУРЫ НОВЫХ ВЕЩЕСТВ И МАТЕРИАЛОВ ИЗ РЕНТГЕНОДИФРАКЦИОННЫХ ДАННЫХ

С. В. Бураков1, А. Н. Залога2, П. С. Дубинин2, О. Е. Пиксина2, И. С. Якимов2

1 Сибирский государственный аэрокосмический университет имени академика М. Ф. Решетнева Российская Федерация, 660014, г. Красноярск, просп. им. газ. «Красноярский рабочий», 31

2Сибирский федеральный университет Российская Федерация, 660025, г. Красноярск, просп. им. газ. «Красноярский рабочий», 95

E-mail: i-s-yakimov@yandex.ru

Разработан и апробирован эволюционный мультипопуляционный генетический алгоритм для моделирования атомной кристаллической структуры вещества из данных рентгеновской порошковой дифракции, интегрированный с методом полнопрофильного анализа рентгенограмм, для использования на многоядерных ПК и вычислительных кластерах.

Ключевые слова: кристаллическая структура, порошковая дифракция, генетические алгоритмы, полнопрофильный анализ, метод Ритвельда.

i Надоели баннеры? Вы всегда можете отключить рекламу.