Актуальные проблемы авиации и космонавтики - 2015. Том 1
УДК 519.68
ЭВОЛЮЦИОННЫЙ ПОДХОД К ПРОБЛЕМЕ ОТБОРА ПРИЗНАКОВ В ЗАДАЧЕ РАСПОЗНАВАНИЯ ЭМОЦИЙ*
И. А. Иванов1 Научный руководитель - Е. А. Сопов2
Сибирский государственный аэрокосмический университет имени академика М. Ф. Решетнева
Российская Федерация, 660037, г. Красноярск, просп. им. газ. «Красноярский рабочий», 31 E-mail: [email protected], [email protected]
Решается подзадача снижения размерности признакового пространства в задаче распознавания эмоций. Проведено сравнение трех подходов к снижению размерности на пяти выборках данных: метод главных компонент, отбор признаков методом однокритериальной и многокритериальной оптимизации. Подход к отбору признаков методом многокритериальной оптимизации обеспечил лучшую точность классификации эмоций на большинстве выборок.
Ключевые слова: отбор признаков, распознавание эмоций, многокритериальная оптимизация, метод главных компонент, метод опорных векторов.
EVOLUTIONARY APPROACH TO FEATURE SELECTION IN EMOTION
RECOGNITION PROBLEM
I. A. Ivanov1 Scientific supervisor - E. A. Sopov2
Reshetnev Siberian State Aerospace University 31, Krasnoyarsky Rabochy Av., Krasnoyarsk, 660037, Russian Federation E-mail: [email protected], [email protected]
Feature space dimensionality reduction sub-problem of emotion recognition problem is being solved. Comparison of three approaches to dimensionality reduction is conducted on five datasets: principal components analysis, feature selection by using single-objective and multi-objective optimization methods. The multi-objective optimization approach to dimensionality reduction provided the best emotion classification accuracy on the majority of datasets.
Keywords: feature selection, emotion recognition, multi-objective optimization, principal components analysis, support vector machine.
Задача машинного распознавания эмоций человека является перспективной прикладной задачей. Системы по распознаванию эмоций используются в диалоговых системах, обеспечивающих человеко-машинное взаимодействие. Задача распознавания эмоций, как и любая другая задача классификации, может быть разбита на три этапа: сбор и подготовка данных, предобработка данных, построение классификатора. Данная работа посвящена этапу предобработки данных, а именно, снижению размерности признакового пространства и отбору информативных признаков.
Классической областью применения методов отбора информативных признаков является молекулярная биология и медицина. В задачах анализа ДНК-микрочипов число признаков может достигать десятков тысяч, тогда как объем выборки не превышает нескольких тысяч. Большая часть признаков, как правило, оказываются малоинформативными, шумовыми. Наиболее часто встречающийся прием - использование стохастических алгоритмов оптимизации, таких как генетические алгоритмы (ГА), particle swarm optimization (PSO) в связке с алгоритмами классификации, например методом опорных векторов или ^-ближайших соседей [1; 2]. Такой оптимизационный подход позволяет находить подмножества признаков, оптимальных по конечной точности решения задачи.
Опишем процесс решения задачи распознавания эмоций по порядку. В качестве исходных данных была взята база данных SAVEE [3], в которой собраны короткие аудио- и видеозаписи четырех
* Работа выполнена в рамках проекта RFMEFI57414X0037.
Секция «Математические методы моделирования, управления и анализа данных»
мужчин, на английском языке читающих набор определенных фраз и имитирующих семь основных эмоций: злость, отвращение, страх, счастье, нейтральное состояние, грусть и удивление. Из аудио и видеозаписей были извлечены количественные признаки. Для извлечения количественных признаков из аудио была использована программа openSMILE [4], количественные признаки из видео были извлечены тремя алгоритмами: Quantized Local Zernike Moments (QLZM), Local Binary Patterns (LBP), Local Binary Patterns on Three Orthogonal Planes (LBP-TOP). Также все выборки были объединены в одну общую выборку с целью проверки улучшения точности классификации эмоций по аудиовизуальным признакам. Размерности полученных выборок представлены в таблице.
Следующий этап - снижение размерности полученных выборок. Были опробованы три подхода к снижению размерности: метод главных компонент (principal components analysis, PCA), отбор признаков (feature selection) методом однокритериальной и многокритериальной оптимизации. В одно-критериальной постановке максимизируемым критерием выступала точность классификации эмоций. В качестве алгоритма классификации был выбран метод опорных векторов. В многокритериальной постановке был добавлен второй критерий - количество используемых признаков. Данный критерий минимизировался, исходя из соображений, что меньшее число признаков обеспечивает простоту модели. Входной переменной в алгоритмах оптимизации служил бинарный вектор длины m, где m -число признаков используемой выборки. Единица в бинарном векторе означала, что признак с порядковым номером данного бита используется в классификации, ноль - не используется.
В качестве алгоритма однокритериальной оптимизации был выбран коэволюционный ГА. Параметры алгоритма: количество независимо работающих ГА: 5, общее число индивидов: 50, число поколений: 50, интервал адаптации: 5, размер штрафа: 10 %, минимальный гарантированный размер популяции ГА: 10 % от исходного. В качестве алгоритма многокритериальной оптимизации был выбран Strength Pareto Evolutionary Algorithm (SPEA). Параметры алгоритма: размер популяции - 50, число поколений -50, вероятность скрещивания - низкая, тип скрещивания - равномерное, максимальный размер внешнего множества - 50, вероятность мутации - низкая. Результаты экспериментов представлены в таблице.
Точность классификации эмоций (%), метод опорных векторов, различные выборки данных и подходы к снижению размерности
Выборки данных Число признаков выборки Точность классификации / новое число признаков
Все признаки Метод главных компонент Отбор п] эизнаков
Однокрит. оптимизация Многокрит. оптимизация
QLZM 656 10.506 21.458 / 36 20.208 / 301 24.911 / 319
LBP-TOP 177 22.847 32.017 / 10 40.278 / 77 45.694 / 90
LBP 59 20.486 23.75 / 4 25.972 / 33 25.694 / 31
Аудио 991 28.542 35.923 / 131 38.095 / 476 39.702 / 484
Аудио + видео 1883 19.732 31.718 / 180 33.661 / 902 35.893 / 885
Как видно из таблицы, подход к отбору информативных признаков методом многокритериальной оптимизации обеспечивает лучшую точность классификации эмоций на большинстве выборок. Объединение в одну выборку признаков, извлеченных из аудио и видео, не дало улучшения точности.
В будущей работе планируется провести более детальное исследование и сравнение представленных подходов к отбору информативных признаков путем использования других алгоритмов классификации, а также других алгоритмов оптимизации при отборе признаков.
Библиографические ссылки
1. Huerta E. B., Duval B. et Hao J.-K. A hybrid GA/SVM approach for gene selection and classification of microarray data. evoworkshops 2006, LNCS, vol. 3907, p. 34-44.
2. Jirapech-Umpai T. et Aitken S. Feature selection and classification for microarray data analysis : Evolutionary methods for identifying predictive genes. BMC bioinformatics, 2005, vol. 6, no. 1, p. 148.
3. Haq S., Jackson P. J. B. Speaker-dependent audio-visual emotion recognition. In Proc. Int. Conf. on Auditory-Visual Speech Processing (AVSP'09), Norwich, UK, p. 53-58, September 2009.
4. Eyben F., Wullmer M., Schuller B. OpenSmile - The Munich Versatile and Fast Open-Source Audio Feature Extractor. In Proceedings ACM Multimedia (MM), ACM, Florence, Italy, ISBN 978-1-60558933-6, p. 1459-1462, 25.-29.10.2010.
© Иванов И. А., 2015