Научная статья на тему 'О решении задачи классификации методом опорных векторов'

О решении задачи классификации методом опорных векторов Текст научной статьи по специальности «Математика»

CC BY
935
89
i Надоели баннеры? Вы всегда можете отключить рекламу.
Область наук
Ключевые слова
КЛАССИФИКАЦИЯ / CLASSIFICATION / МЕТОД ОПОРНЫХ ВЕКТОРОВ / SUPPORT VECTOR MACHINE

Аннотация научной статьи по математике, автор научной работы — Федотов Д. В.

Решается задача классификации линейно разделимых и линейно неразделимых выборок с помощью метода опорных векторов. Представлена эффективность метода при различных настройках.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Федотов Д. В.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

ON USING SUPPORT VECTOR MACHINE FOR SOLVING CLASSIFICATION PROBLEM

The classification problem for linearly separable and linearly inseparable samples is solving. Efficiency of the method used with different settings is presented.

Текст научной работы на тему «О решении задачи классификации методом опорных векторов»

Артефакты обусловлены особенностями алгоритмов, генерирующих эти файлы. В частности, эти SP3-файлы стыкуются из 1-часовых непрерывных кусков.

В таблице приводится сравнение коэффициентов модели РД BERNE, найденных классическим способом [2; 3] и способом, предлагаемым в данной работе, а также расхождение траекторий, получаемых при решении уравнения движения с соответствующими значениями уточняемых параметров.

Предложенный алгоритм может использоваться для быстрой оценки параметров модели движения, а также для изучения особенностей табличных эфемерид КА.

Библиографические ссылки

1. Fliegel H., Gallini T., Swift E. Global Positioning System radiation force model for geodetic applications // J. of Geophysical Research. 1992. No. B1. P. 559-568.

2. Froideval L. A Study of Solar Radiation Pressure acting on GPS Satellites // Proquest. Umi Dissertation Publishing, 2001. 198 p.

3. Bar-Sever Y., Kuang D. Improved Solar-Radiation Pressure Models for GPS Satellites // NASA Tech Briefs. 2006, NP0-41395.

4. Springer T., Beutler G., Rothacher M. A New Solar Radiation Pressure Model for the GPS Satellites // GPS Solutions. 1998. P. 50-62.

5. URL: http://igscb.jpl.nasa.gov/mail/igsmail/2006/ msg00170.html.

6. URL: http://maia.usno.navy.mil/.

7. Царев С. П., Лобанов С. А., Оценка разрывов и аномальных выбросов в финальных орбитах обрабатывающих центров IGS // Решетневские чтения : материалы Междунар. конф. / СибГАУ. Красноярск, 2013.

References

1. Fliegel H., Gallini T., Swift E. Global Positioning System radiation force model for geodetic applications // Journal of Geophysical Research, 1992. No. B1, P. 559-568.

2. Froideval L. A Study of Solar Radiation Pressure acting on GPS Satellites // Proquest, Umi Dissertation Publishing, 2001. 198 p.

3. Bar-Sever Y., Kuang D. Improved Solar-Radiation Pressure Models for GPS Satellites // NASA Tech Briefs, 2006, NP0-41395.

4. Springer T., Beutler G., Rothacher M. A New Solar Radiation Pressure Model for the GPS Satellites // GPS Solutions, 1998. P. 50-62.

5. http://igscb.jpl.nasa.gov/mail/igsmail/2006/msg00 170.html.

6. http://maia.usno.navy.mil/.

7. Tsarev S. P., Lobanov S. A., Ocenka razryvov i anomal'nyh vybrosov v final'nyh orbitah obrabatyvajushhih centrov IGS // Reshetnevskie chtenija : Materialy mezhdunarodnoj konferencii / SibGAU. Krasnojarsk, 2013.

© Ушаков Ю. Ю., 2013

УДК 519.85

О РЕШЕНИИ ЗАДАЧИ КЛАССИФИКАЦИИ МЕТОДОМ ОПОРНЫХ ВЕКТОРОВ

Д. В. Федотов

Сибирский государственный аэрокосмический университет имени академика М. Ф. Решетнева Россия, 660014, г. Красноярск, просп. им. газ. «Красноярский рабочий», 31. Е-mail: [email protected]

Решается задача классификации линейно разделимых и линейно неразделимых выборок с помощью метода опорных векторов. Представлена эффективность метода при различных настройках.

Ключевые слова: классификация, метод опорных векторов.

ON USING SUPPORT VECTOR MACHINE FOR SOLVING CLASSIFICATION PROBLEM

D. V. Fedotov

Siberian State Aerospace University named after academician M. F. Reshetnev 31, "Krasnoyarsky Rabochy" Av., Krasnoyarsk, 660014, Russia. E-mail: [email protected]

The classification problem for linearly separable and linearly inseparable samples is solving. Efficiency of the method used with different settings is presented.

Keywords: classification, support vector machine.

В современном мире человек ежедневно сталкивается с большим объемом информации, требующим обработки и анализа. В случае фирм и предприятий, количество поступающей информации возрастает, и

зачастую необходимо разбить ее на части, найти закономерности изучаемых феноменов, выделить группы объектов. Для решения задач такого типа используются алгоритмы классификации и кластеризации.

Решетневскуе чтения. 2013

Общая задача классификации звучит следующим образом: пусть X - множество объектов, Y - множество номеров (имен, меток) классов. Существует неизвестная целевая зависимость - отображение X^-Y, значения которой известны только на объектах конечной обучающей выборки. Требуется построить алгоритм, аппроксимирующий целевую функцию на всем множестве X. В случае решения задачи методом опорных векторов (Support Vector Machine) рассматривается задача классификации на два непересекающихся класса, в которой объекты описываются n-мерными вещественными векторами. Строится линейный пороговый классификатор [1; 2].

Необходимо найти и построить гиперплоскость вида wTx + b = 0, разделяющую объекты на два класса с максимальной граничной областью. В случае линейной разделимости выборки на два непересекающихся подмножества, построение гиперплоскости сводится к решению задачи условной оптимизации, которая с помощью методов Лагранжа может быть сведена к задаче квадратичного программирования.

Однако в реальных задачах линейно разделимые выборки встречаются крайне редко. В случае, когда выборки линейно неразделимы, граничные области могут быть отрицательными. Это приводит к невозможности решения задачи квадратичного программирования. Для решения линейно неразделимых задач обычно применяют два подхода:

1. Ослабить жесткие ограничения, что приводит к так называемой «мягкой» граничной области.

2. Применить ядерные функции для линеаризации нелинейных задач.

В методе опорных векторов с «мягкой» граничной областью расширяется стандартный метод опорных векторов и позволяет некоторым точкам нарушать ограничения. В частности, вводятся дополнительные переменные для учета количества ошибок классификации. Другая распространенная техника для решения линейно неразделимых задач - метод ядер. Идея заключается в определении ядерной функции, основанной на скалярном произведении данных как нелинейного перехода от пространства входных данных к пространству с большим (иногда бесконечным) количеством измерений с целью сделать задачу линейно разделимой. В результате использование ядерных функций делает алгоритм нечувствительным к размерности пространства [3].

Для исследования эффективности метода опорных векторов были проведены тесты на различных настройках для генерации выборки и поиска разделяющей гиперплоскости. В работе использовались 3 типа выборок:

1. Линейно разделимая

2. Линейно неразделимая, с проникновением одного класса в другой, вызванным близким расположением центров класса и высокой дисперсией.

3. Линейно неразделимая, созданная полиномом 2-5 степеней.

Для решения поставленных задач классификации использовались линейный и нелинейный (использующий Гауссову радиальную базисную функцию) варианты метода. При решении задачи классифика-

ции на 1 типе выборки (линейно разделимая) оба варианта метода показывают безупречную работу (ошибка классификации составляет 0 %). При проникновении одного класса в другой ошибка резко возрастает. При незначительном проникновении нелинейный вариант метода показывает более высокие результаты, чем линейный, но при увеличении степени проникновения классов это преимущество исчезает и ошибка классификации достигает 40 % (случай, когда объекты различных классов равномерно распределены в пространстве). Значительное превосходство нелинейного варианта метода над линейным можно заметить на выборке, созданной полиномами. На рис. 1, 2 представлены разделяющие гиперплоскости, полученные в результате работы метода на линейно неразделимой выборке, созданной полиномом.

S

; . I I 1 , 1 I. ..1 1

-2 -1.5 '1 1СВ и 0.5 1 15 2

Рис. 1. Разделяющая гиперплоскость, линейно неразделимая выборка, созданная полиномом, линейный вариант метода

- $ Л+++ + 1 -+

+ / SET ' ° °о ж о о Ь- о ® о0® О со . +

ОС ъ® о о\ 4 о X

о о о п.

о зр

-

я -1.5 1 -да S 0-5 i 1.5 Щ

Рис. 2. Разделяющая гиперплоскость, линейно неразделимая выборка, созданная полиномом, нелинейный вариант алгоритма

В данном случае ошибки классификации составляют 15 и 2 % соответственно. При увеличении степени полинома ошибки классификации растут, но нелинейный вариант продолжает показывать заметно более высокие результаты по сравнению с линейным.

После проведения более детальных исследований метода было сделано следующее заключение: данный классификатор показывает отличные результаты

в случае линейно разделимых выборок. Также он применим и к линейно неразделимым классам, но с некоторыми потерями в качестве классификации. Если выборка не имеет четких закономерностей и является смесью объектов из двух классов, то линейный классификатор будет иметь ошибку, стремящуюся к 50 %, а нелинейный при меньшей ошибке на обучающей выборке может иметь большую ошибку на тестовой. При наличии же неких закономерностей генерации выборки, например при выборке, созданной полиномом, нелинейный классификатор имеет значительно меньшую ошибку, чем линейный и поэтому лучше применим к таким типам задач.

Библиографические ссылки

1. Айвазян С. А., Бухштабер В. М., Енюков И. С., Мешалкин Л. Д. Прикладная статистика: классификация и снижение размерности. М. : Финансы и статистика, 1989. 607 с.

2. Воронцов К. В. Лекции по методу опорных векторов [Электронный ресурс]. URL: http://www.ccas.ru/voron/download/SVM.pdf (дата обращения: 11.09.2013).

3. Xindong Wu, Vipin Kumar. The Top Ten Algorithms in Data Mining. Data Mining and Knowledge Discovery Series. 2009. 201 с.

References

1. Ayvazyan S. A., Bukhshtaber V. M., Yenyukov I. S., Meshalkin L. D. Prikladnaya statistika: klassifikatsiya i snizheniye razmernosti. M. : Finansy i statistika, 1989. 607 p.

2. Vorontsov K. V. Lektsii po metodu opornykh vektorov. URL: Available at: http://www.ccas.ru/voron/ download/SVM.pdf.

3. Xindong Wu, Vipin Kumar. The Top Ten Algorithms in Data Mining. Data Mining and Knowledge Discovery Series. 2009. 201 p.

© Федотов Д. В., 2013

УДК 539.1.01

ПОТЕНЦИАЛЬНАЯ ЯМА С ДОПОЛНИТЕЛЬНЫМИ ИЗМЕРЕНИЯМИ

В. А. Фельк

Сибирский государственный аэрокосмический университет имени академика М. Ф. Решетнева Россия, 660014, г. Красноярск, просп. им. газ. «Красноярский рабочий», 31

Е-mail: [email protected]

Исследуется влияние компактифицированного геометрического многообразия на энергетический спектр квантовой системы. Получены поправки к энергетическому спектру в потенциальной яме бесконечной глубины для данной ситуации. Намечен путь для экспериментальной проверки данного феномена.

Ключевые слова: компактификация, теория Калуцы-Клейна, М-теория, энергетический спектр.

POTENTIAL HOLE WITH ADDITIONAL DIMENSIONS

V. A. Fel'k

Siberian State Aerospace University named after academician M. F. Reshetnev 31, "Krasnoyarsky Rabochy" Av., Krasnoyarsk, 660014, Russia. E-mail: [email protected]

In work influence of compactify geometrical variety on a energy spectrum of quantum system is investigated. Мodiflcations to a energy spectrum in a potential hole of infinite depth for this situation are received. The way for experimental check of this phenomenon is designed.

Keywords: compactification, Kaluza-Klein theory, M-theory, energy spectrum.

Цель данной работы - на примере модели потенциальной ямы бесконечной глубины исследовать влияние дополнительных пространственных измерений на энергетический спектр системы.

Актуальность работы обусловлена необходимостью экспериментальной проверки одного из ключевых следствий теорий поля типа Калуцы-Клейна, заключающегося в существовании компактных дополнительных измерений [1]. В современных физических

теориях, претендующих на описание свойств реальности на глубоко фундаментальном уровне, говорится о необходимости введения дополнительных пространственных измерений, обеспечивающих непротиворечивость математического аппарата [2]. Необходимость введения дополнительных измерений возникает в рамках геометрической парадигмы. К этим теориям относятся геометрические теории типа Калуцы-Клейна и их современные версии: теория суперструн

i Надоели баннеры? Вы всегда можете отключить рекламу.