УДК 52-601
К АНАЛИЗУ НЕПАРАМЕТРИЧЕСКИХ АЛГОРИТМОВ РОБАСТНОГО ОЦЕНИВАНИЯ
С. С. Чернова
Сибирский федеральный университет Институт космических и информационных технологий Российская Федерация, 660074, г. Красноярск, ул. Академика Киренского, 26Б E-mail: [email protected]
Рассматриваются алгоритмы восстановления функции регрессии в условиях выброса данных. Особенностью предложенного робастного оценивания является исключение выбросов.
Ключевые слова: непараметрические оценки функции регрессии, робастное оценивание.
TO THE ANALYSIS OF NON-PARAMETRIC ALGORITHMS OF ROBUST ESTIMATION
S. S. Chernova
Siberian Federal University Institute of space and information technologies 26B, Academica Kirenskogo Str., Krasnoyarsk, 660074, Russian Federation E-mail: [email protected]
Algorithms for restoring the regression function under the conditions of data ejection are considered. A feature of the proposed robust estimation is the elimination of emissions.
Keywords: nonparametric estimations of the regression function, robust estimation.
Введение. Рассматривается задача восстановления цессе формирования выборки искусственно был до-функции регрессии [1] при наличии выбросов в ис- бавлен выброс.
ходных данных. Предложена методика робастного оценивания [2; 3], особенностью которой является корректировка выборки данных, то есть исключение выбросов и их влияния на восстановление функции.
Непараметрическое оценивание функции регрессии. В качестве непараметрической оценки функции регрессии рассмотрим оценку Надарая-Ватсона [4; 5] для случая, если х ^-мерный вектор (1):
y (x )=Z У, П ф
i=1 j=1
(1)
- i Ф
r- J
\
dx = 1,
(2)
lim—Ф
n^œ c
( x - X. ^
= 5(x-x, ).
А параметр размытости - cs удовлетворяет условиям (3):
' (3)
cs > 0, lim s (cs ) = œ, lim cs = 0.
Численное исследование. Для проведения эксперимента выбрана функция: у = cos(x)2*sin(x). В про-
Для оценивания точности непараметрической оценки используем квадратичный критерий:
=T(y. - y ( x. ) )2
(4)
где у г - истинная выборка; у/х,) - непараметрическая оценка.
Элементы обучающей выборки, удовлетворяющие требованию:
Р,2 > 2а2, (5)
2 / , ч\2
где х,, у, , = 1,5 , выборка наблюдений, содержащая выбросы; Ф(у) - колоколообразная функция; V - произвольная переменная; с5 - параметр размытости. Ф^) удовлетворяет следующим условиям (2):
0 <Ф(V)<<», Vv eD(v),
где р2 =(у,. - у5 (х,)) ,, = 1,5 , удаляются из исходной выборки.
В ходе исследования также был рассмотрен вариант восстановления с помехой, ^ = уД, где
£ е [-1;1], I - уровень помех.
На рис. 1-3 будут использоваться следующие обозначения: 1 - обучающая выборка, 2 - непараметрическая оценка.
Приведем результаты численного исследования, иллюстрирующие эффективность алгоритма. Рассмотрим восстановление функции регрессии по наблюдениям, которая имеет выброс при объеме выборки 5 = 100.
На рис. 1. представлена восстановленная функция по имеющейся выборке. На рис. 2. то же самое восстановление, но уже с помехой 5 %. По критерию точности видим, что помеха ухудшает результат восстановления.
,=1
Математические методы моделирования, управления и анализа данных
Рис. 1. Восстановленная функция, а2 = 0,31
Рис. 2. Восстановленная функция, I = 5 %, а2 = 0,33
Рис. 3. Восстановленная функция без выбросов, а2 = 0,04
Рис. 3 отображает работу алгоритма (5) и показывает хороший результат восстановления функции.
Заключение. Основным результатом исследования является возможность восстанавливать данные, несмотря на имеющиеся выбросы в исходной выборке.
Следует заметить, точность восстановления достаточно улучшилась, когда исключили выброс из выборки для восстановления функции регрессии.
Библиографические ссылки
1. Чернова С. С., Шишкина А. В. О непараметрическом оценивании взаимно неоднозначных функций по наблюдениям // Молодой ученый. 2017. № 25. С. 13-20.
2. Хьюберг П. Робастность в статистике. М. : Мир, 1984. 304 с.
3. Шуленин В. П. Робастные методы математической статистики. Томск : НТЛ, 2016. 210 с.
4. Надарая Э. А. Непараметрическое оценивание плотности вероятностей и кривой регрессии. Тбилиси : ТГУ, 1983. 194 с.
5. Медведев А. В. Основы теории адаптивных систем / Сиб. гос. аэрокосмич. ун-т. Красноярск, 2015. 526 с.
References
1. Chernova S. S., Shishkina A. V. [On nonparamet-ric estimation of mutually ambiguous functions from observations]. Molodoi uchenyi. 2017. No. 25. P. 13-20. (In Russ.)
2. H'yuberg P. Robastnost v statistike [Robustness in statistics]. Moscow, Mir Publ., 1984. 304 p.
3. SHulenin V. P. Robastnye metody mate-maticheskoj statistiki [Robust methods of mathematical statistics]. Tomsk: NTL Publ., 2016. 210 p.
4. Nadaraia E. A. Neparametricheskoe otsenivanie plotnosti veroiatnostei i krivoi regressii [Nonparametric estimation of probability density and regression curve]. Tbilisi, TGU Publ., 1983. 194 p.
5. Medvedev A. V. Osnovy teorii adaptivnykh system [Fundamentals of the theory of adaptive systems]. Krasnoyarsk, SibGAU Publ., 2015. 526 p.
© Чернова С. С., 2018