Решетневские чтения. 2017
УДК 519.2
ОБЗОР МЕТОДОВ ВОССТАНОВЛЕНИЯ ФУНКЦИИ ПЛОТНОСТИ ВЕРОЯТНОСТИ
В. В. Браништи
Сибирский государственный университет науки и технологий имени академика М. Ф. Решетнева Российская Федерация, 660037, г. Красноярск, просп. им. газ. «Красноярский рабочий», 31
E-mail: [email protected]
Рассматриваются распространённые методы восстановления функции плотности вероятности: гистограмма, проекционная оценка и оценка Розенблатта-Парзена. Указываются преимущества и недостатки каждого из подходов, а также рассматриваются различные критерии качества оценивания.
Ключевые слова: непараметрическая статистика, функция плотности вероятности, гистограмма, проекционная оценка, оценка Розенблатта-Парзена.
REVIEWING METHODS TO RECOVER PROBABILITY DENSITY FUNCTION
V. V. Branishti
Reshetnev Siberian State University of Science and Technology 31, Krasnoyarsky Rabochy Av., Krasnoyarsk, 660037, Russian Federation E-mail: [email protected]
The paper describes the well known methods of probability density function recovery: histogram, projection estimate and Rosenblatt-Parzen estimate. We show advantages and disadvantages for every approach and consider different criteria of estimation quality.
Keywords: nonparametric statistics, probability density function, histogram, projective estimates, Rosenblatt-Parzen estimate.
Введение. Оценивание функции плотности вероятности случайной величины является одной из основных задач в математической статистике [1]. Алгоритмы восстановления неизвестной плотности вероятности используются в системах поддержки принятия решений, а также при построении систем автоматического управления и алгоритмов идентификации технических систем, в том числе, в аэрокосмической отрасли.
Перспективным направлением решения данной задачи являются непараметрические методы оценивания, к которым относятся гистограммные оценки, проекционная оценка [2; 3] и оценка Розенблатта-Парзена [4].
В настоящей работе предлагается введение некоторой обобщённой оценки функции плотности вероятности, частными случаями которой являются все три указанных метода восстановления. Далее рассматривается метод сравнения качества оценок в условиях конечных выборок.
Обобщённая оценка плотности вероятности. В работе [5] предложена обобщённая оценка функции плотности вероятности непрерывной случайной величины ^ в виде суммы 5-образных функций:
1 п
д х)=-&(х, х,.), п ы
где х1, ..., хп - независимая выборка исследуемой случайной величины 4, 5п(х, х,) - последовательность
5-образных функций, сходящаяся к 5-функции Дирака 5(х - х) в смысле сходимости обобщённых функций [6, с. 222]. Там же показано, что гистограмма, проекционная оценка и оценка Розенблатта-Парзена являются частными случаями предложенной обобщённой оценки при определённом выборе последовательности 5-образных функций.
Методика сравнения оценок. В ряде работ (например, в [1; 7]) приводятся асимптотические соотношения для оценок плотности вероятности, т.е. при неограниченном увеличении выборки исследуемой случайной величины. Однако с практической точки зрения более важным является сравнение качества оценок в условиях выборки конечного объёма п.
Для сравнения качества оценивания в работе [7] вводится усреднённая глобальная квадратичная ошибка аппроксимации:
(1)
Q {M ¥ - f\
и относительная глобальная ошибка аппроксимации
'2=сгм ^ -71
где 7 - истинная плотность вероятности; / - её оценка, ц.ц - норма в пространстве Ь2.
Так как теоретический расчёт данных функционалов затруднён даже для модельных распределений, то
Математические методы моделирования, управления и анализа данных
предлагается их значения находить методом Монте-Карло. Пусть численный эксперимент проведён N раз
и получена выборка ^^ значений z = ||/ - /|| . Тогда
значение (1) приближённо рассчитывается следующим образом [8]:
е {)■
где
- 1
Z =-Y Nil
1 N 2
—Ziz -Z) .
N-1 ' '
Выводы. Сравнение рассматриваемых методов восстановления плотности вероятности проводилось на тестовых законах распределения, различающихся по ряду критериев: непрерывность, гладкость, симметричность, финитность и др. Как показало сравнение, качество проекционной оценки существенно зависит от наличия разрывов истинной плотности, тогда как для оценки Розенблатта-Парзена это не было существенным. В целом, оценка Розенблатта-Парзена показала лучшую аппроксимацию в широком классе распределений. Оценка в виде гистограммы показала меньшую скорость сходимости по сравнению с остальными рассмотренными непараметрическими оценками.
Библиографические ссылки
1. Деврой Л., Дьёрфи Л. Непараметрическое оценивание плотности. ^-подход. М. : Мир, 1988. 408 с.
2. Браништи В. В. Введение пространства L2,w при построении проекционной оценки плотности вероятности // Вестник СибГАУ. 2016. Том 17, № 1. С. 19-26.
3. Браништи В. В. Построение проекционных оценок для плотностей вероятности с неинтегрируемым квадратом // Решетневские чтения : материалы XX Междунар. науч. конф. (09-12 ноября 2016, г. Красноярск) : в 2 ч. / под общ. ред. Ю. Ю. Логинова ; Сиб. гос. аэрокосмич. ун-т. Красноярск, 2016. Ч. 2. С. 96-98.
4. Parzen E. On estimation of a probability density function and mode // The Annals of Mathematical Statistics, 1962. Vol. 35, 3. P. 1065-1076.
5. Браништи В. В. Построение оценок плотности вероятности в виде суммы дельтаобразных функций //
Национальная ассоциация ученых. 2015. № 4 (9), ч. 7. С. 10-13.
6. Колмогоров А. Н., Фомин С. В. Элементы теории функций и функционального анализа. 7-е изд. М. : Физматлит, 2004. 572 с.
7. Епанечников В. А. Непараметрическая оценка многомерной плотности вероятности // Теория вероятностей и ее применения, 1969. Т. 14, вып. 1. С. 156-161.
8. Браништи В. В. О параметрическом оценивании функции плотности вероятности // Научно-технический вестник Поволжья. 2014. № 1. С. 13-16.
References
1. Devroye L., Gyorfi L. Nonparametric density estimation. The Li view. John Wiley & Sons, 1985. 367 p.
2. Branishti V. V. Introducing the L2,w space for building the projective estimation of probability density function // Vestnik SibSAU. 2016. Vol. 17, No. 1. P. 1926. (In Russ.)
3. Branishti V. V. Construction of projective estimates for non square-integrable probability densities // Materialy XX Mezhdunar. nauch. konf. "Reshetnevskie chteniya" [Materials XX Intern. Scientific. Conf "Reshetnev reading"]. Krasnoyarsk, 2016. Vol. 2. P. 96-98. (In Russ.)
4. Parzen E. On estimation of a probability density function and mode // The Annals of Mathematical Statistics. 1962. Vol. 35, 3. P. 1065-1076.
5. Branishti V. Building a probability density estimations by sum of delta-shaped functions // Natsional'naya assotsiatsiya uchenyh. 2015. № 4 (9), Vol. 7. P. 10-13.
6. Kolmogorov A. N., Fomin S. V. Elementy teorii funktsiy i funktsional'nogo analiza [Elements of theory of functions and functional analysis]. M. : Fizmatlit Publ., 2004. 572 p. (In Russ.)
7. Epanecnikov V. A. Nonparametric estimation of a multidimensional probability density // Teoriya veroyatnostey i ee primeneniya, 1969. Vol. 14, Iss. 1. P. 156-161. (In Russ.)
8. Branishti V. V. [On parametric estimation of probability density function] // Nauchno-tekhnicheskiy vestnik Povolzh'ya. 2014. № 1. P. 13-16. (In Russ.)
© Браништи В. В., 2017
z. , s„ =