Дегтярева О.А. АППРОКСИМАЦИЯ ГЛАДКИХ ПЛОТНОСТЕЙ ВЕРОЯТНОСТИ В ОРТОГОНАЛЬНЫХ БАЗИСАХ, ОПРЕДЕЛЕННЫХ НА ПОЛУОСИ
Теория ортогональных функций в применении к аппроксимации плотности вероятности имеет свои особенности. Например, частичные суммы разложения по ортогональному базису могут не обладать свойствами плотности вероятности, и для обеспечения выполнения этих свойств нужно принимать специальные меры.
Для аппроксимации плотности вероятности, определенной на всей числовой оси (—го; +го) , используются
системы ортогональных функций, которые также определены на всей числовой оси, такие как функции Эр-мита, тригонометрические и другие [1]. Оценка плотности вероятности в таком случае записывается следующим образом:
т
СМ (Х) = ГРмЩк (Х,Х) , (1)
I
N,
к=0
где N - объем выборки (длина дискретной реализации случайного процесса);
щ (х) , к = 0,1, 2,... - полная система функций, обладающих следующим свойством ортогональности
Г0, к Ф п; щ (Х,а)щп (Х,«)Л = • 2 , ;
[И , к = п.
X - масштабирующий коэффициент, Вм к ” оценки для коэффициентов разложения по ортогональному базису. Эти оценки рассчитываются следующим образом : для проекционной оценки [2]
В = — Г Щк (Х‘) (2)
для гистограммно-аппроксимационной оценки, которая основана на сглаживании полигона частот, построенного по выборке [3]
1 го
Рм,к = й—и I /р (хЩк (Хх)^ , (3)
—го
где ср (х) - полигон частот.
Однако для решения поставленной задачи возможно использование систем ортогональных функций, определенных на полуоси [0; +го), например, функции Лагерра, Лежандра, Дирихле [1]. В этом случае оценка плотности вероятности запишется следующим образом: т тл
См(Х) = Ъ(Рм,к)пЩ (Х — Х0)1(Х — Х0) + Г(рмк)лЩ (Х0 — Х) 1(Х0 — х), (4)
к=0 к=0
где Х0 - точка, в которой плотность не равна 0, например, точка максимума полигона, построенного
по реализации; т , т - число слагаемых в аппроксимирующих суммах для правой и левой ветвей;
Г1 , при х > 0;
1(х)=•^ - единичная функция.
[0, при х < 0.
Коэффициенты разложения рассчитываются по следующим формулам: для проекционной оценки
(я \ (в щ(х0 х)
(Вм,к )п дт Г || ||2 , (Вм , к )л дт Г || ||2 ,
■^4 т\\ м^л т\\
где
/п - множество тех значений индекса л_, при которых выборочные значения х( е(х0; +го) ; /л
множество тех значений индекса л_, при которых Х( Е(—го;Х0] .
^ го ^ Х0
(рм,к)п = =-р-1Ср(Х)щ(х-—А)* , (Вмк)л==17 1 Ср(Х)щ(Х0~Х,ал)Ах •
для гистограммно-аппроксимационной оценки
, 1.р; 0 (б)
Щк\\ Х0 Щк\\‘ —ГО ' '
При этом выражение для погрешности аппроксимации примет вид:
(т„ т„ \
А= I/2 (х) ах — Ё 1Ы12 (рмк )2+Г 1Ы12 (р=)2
... Ч_ , | (7)
==== к=0
где С (х) - оцениваемая кривая. Для проекционной оценки это /у ( х) - теоретическая плотность
вероятности, для гистограммно-аппроксимационного оценивания это Ср (х) - полигон частот.
Как уже отмечалось, построенные оценки плотности вероятности (1), (4) могут не обладать основными
свойствами плотности вероятности. Преобразование этих оценок к плотности вероятности (неотрицательность и равенство площади под кривой единице) описано в [1,3].
В большинстве случаев оценка (4) не обладает свойствами непрерывности и гладкости. Такая ситуация может возникнуть в случае неравных масштабирующих параметров для отдельных ветвей или различного числа элементов в сумме ряда.
Для устранения разрыва оценки в точке склеивания правой и левой ветвей нужно обеспечить выполнение следующего равенства, верного и для проекционных, и для гистограммно-аппроксимационных оценок:
тп тл
)щк(°,х„)^(^.к)лЩ(0,хл) • (8)
к=0 к=0
Отметим, что используемые в равенстве (8) коэффициенты (ЪМ,к )
п(л)
должны минимизировать квадратиче-
скую погрешность аппроксимации, обеспечивать выполнение свойства нормировки плотности распределения вероятностей [3], а также обеспечивать «склеивание» аппроксимирующих правую и левую ветви функций в точке разделения. Применим метод множителей Лагранжа для расчета коэффициентов Ъкп , Ьк л . Получим:
1 А1Б2 — А2Б1 /л л -----к-2--щ(0, Хп);
(9)
К,п =(&а)п - А2Б22 Ы(°,ап)І
А3А1 А2
К
Б1А3 А2Б2
АЛ -А,2
(—і (0, “л )/
2| |^-| | АзА1— А22 1 А, Бл — А^Бл
где Б1 =
)П1Ы |2 (—і (0,“п)) + ПЛл )Л1И |2(—і (0,“л))—1
Б2 =
"‘п "‘Я
Т,(Рм,к )п і(0, “п) — £(Рм,к )л і(0, “я)
А, =
2ІПІ N12 (—і(°,“п))2' + 2Ё1И12 (—і (0,“л))2'
А2 =
2(—і(0,“п))' і(0,“п) — Х(—і(0,“л))' і(0,“л) /=0 /=°
- і=0
На рисунке 1 изображены примеры устранения разрыва оценки плотности вероятности с использованием формулы (9). Коэффициенты разложения обеспечивают склеивание правой и левой ветвей оценки и минимизируют среднеквадратическую погрешность аппроксимации (7). Аппроксимация проводилась в базисах Ла-герра (рис. 1а), 1б) ) и Лежандра (рис. 1в), 1г) ) . Отметим, что если аппроксимация проводится в
базисах, определенных на всей числовой оси (например, Эрмита (рис. 1д), 1е) ), то пересчет коэффици-
ентов для склеивания аппроксимирующих кривых не требуется.
Если использовать данную методологию, то при аппроксимации правой и левой ветвей плотности вероятности С (Х), определенной на всей числовой оси, в точке «склеивания» х0 ветвей может возникнуть излом (см. рис. 1). В тех случаях, когда известно, что искомая плотность вероятности является гладкой функцией, или когда с практической точки зрения целесообразно получить гладкую оценку См(Х)
плотности вероятности, необходимо обеспечить «гладкое склеивание» достичь соблюдением следующего равенства:
зетвеи в точке
Этого можно
(х)
dx
или
(х)
х=хо —0
йх
(10)
=Х0 + 0
а) гистограммно-аппроксимационная оценка с разбиением в базисе Лагерра без «склеивания»
б) гистограммно-аппроксимационная оценка с разбиением в базисе Лагерра со «склеиванием»
+
х
0 •
в) гистограммно-аппроксимационная оценка с разбиением в базисе Лежандра без «склеивания»
г) гистограммно-аппроксимационная оценка с разбиением в базисе Лежандра со «склеиванием»
0,32 -0,3 -0,280,260,240,22 -0,2 0,180,16 -0,14 0,12 -0,1 0,080,06 0,040,020-
-2 -1 0 1 2 3 4 5 6
д) проекционная оценка в базисе Эрмита
е) гистограммно-аппроксимационная оценка в базисе Эрмита Рисунок ї - «Склеивание» аппроксимирующих функций
d
E(bN.t )nh (x-—0.«n )
dx
l(bN.k)лhk(X0 ~—.«л)
dx
x_x0 +0
(11)
t_ xo —0
Кроме выполнения равенства (11) коэффициенты разложения (Ъ^к) , (Ъ^А) должны обеспечивать минимум
квадратической погрешности и склейку аппроксимирующих кривых в точке разбиения с одновременным выполнением основного свойства плотности вероятности. Найдем их, используя метод множителей Лагранжа.
Ь (в ^ В1Г22 — Г12В2 ( щ (0 X )) — (0 Хп) В2Г11 Г21В1
Ъ^п = В)п-ТТ^—К-К(щ(0,Хп)) ■ Г22ГП — Г21Г12
Г22 Г11 Г21Г1
— P(i.«n) Г В3 В1Г22 ~ Г12В2 ■ А31 В2Г11 ~ Г21В1 ■ А32
2|h|| О Г22Г11~ О О 2 О Г22Г11 ~ ОО A33
Ь.л _ (Bn, )л - (-hi(0.«л)) +
ВГ(( Г1(В( і ,-ґ\ „ h(0.«л) ■ В(Г11 Г(1В1 + (12)
Г((Г11 Г(1Г1(
Г((Г11 Г(1Г1(
Р(‘.«Л) I В3 В1Г22 Г12В2 А31 В2Г11 Г21В1 A3;
(|hi|| lA33 Г22Г11 Г21Г12 A33 Г22Г11 Г21Г12 A33
где Б1 _
2innN.k )J|hk||2 (“hi (0. «n ))t + 2!{nN.k )Jhk|| 2(-hk (0.«л ))kl
All
(ZW |2 (-h* (° ))2k+(k л ||2 (n (° «л ))2
ko
A12 _ _
"л
1(—hk(0.«n)) hk(0.«n)— Z(—hk(0.«л)) hk(0.«л) k=0 k=0
mn тл
Ї (-hk(0 «n пП^, «n) - 2 (л (0 «л) f k(k «л) ko ko
n "л
in ( nN. k )nhk (0 . «n ) — і (В k )д hk (0 . «л )
k=0
k=0
A22
^23 = A3( =
1 -y P(k. «n )hk (0 . «n ) . 1 * P(k . «л )hk (0. «л ) О 2 II l|( О 2 II l|(
llhl
Б3 = 1» )„ P(k «n )-I^k )Л P(k «л )
Л «) impfe«)
33 2ko Ikkl2 +k0 hk
g А3Б3
. 1 A33 _
Л23Б3
Б,
Г,, =
, А,
/1 A13A32
A12
4 A(3A31
A(1 4
Л( —:
+
Б( =
а Р(к ,“п( л)) =
й {ік ( х,“п( л)))
йх
и зависит от своИств ортогонального базиса.
х=0
На рисунке 2 приведены примеры устранения излома в точке склеивания аппроксимирующих ветвей для гистограммно-аппроксимационных оценок плотности вероятности в базисах Лагерра и Лежандра. Аналогичная картина имеет место и для проекционных оценок.
а) Гистограммно-аппроксимационная оценка с разбиением в базисе Лагерра со «склеиванием»
б) Гистограммно-аппроксимационная оценка с разбиением в базисе Лагерра с « гладким склеиванием»
в) Гистограммно-аппроксимационная оценка с разбиением в базисе Лежандра со «склеиванием»
г) Гистограммно-аппроксимационная оценка с разбиением в базисе Лежандра с «гладким склеиванием»
Рисунок 2.3 «Гладкое склеивание» аппроксимирующих выражений
Следует отметить, что построенные оценки обладают свойством непрерывности, гладкости и являются плотностями вероятностей. Проведенные исследования показывают, что обеспечение «гладкого склеивания» аппроксимирующих выражений может сопровождаться некоторым увеличением погрешности аппроксимации.
Предложенные алгоритмы «склеивания» и «гладкого склеивания» позволяют получить непрерывные и гладкие оценки плотности вероятности с сохранением ее основных свойств (неотрицательность и равенство площади под кривой единице), а также минимизировать квадратическую погрешность аппроксимации с учетом перечисленных свойств.
ЛИТЕРАТУРА
1. Абрамовиц М., Стиган И. Справочник по специальным функциям. - М.: Наука, 1979. - 832 с.
2. Деврой Л. , Дьерфи Л. Непараметрическое оценивание плотности. Ь1 - подход. Пер. с англ. - М.: Мир, 1988. - 408 с
3. Дегтярева О.А. Оценивание плотности вероятности в ортогональных базисах с учетом свойств плотности вероятности. / Материалы научно-практической конференции «Инновации в условиях развития информационно- коммуникационных технологий». - М.:МИЭМ, 2006. - 484 с.