Аппроксимация гладких плотностей вероятности в ортогональных базисах, определенных на полуоси

Дегтярева О.А.

Дегтярева О.А. АППРОКСИМАЦИЯ ГЛАДКИХ ПЛОТНОСТЕЙ ВЕРОЯТНОСТИ В ОРТОГОНАЛЬНЫХ БАЗИСАХ, ОПРЕДЕЛЕННЫХ НА ПОЛУОСИ

Теория ортогональных функций в применении к аппроксимации плотности вероятности имеет свои особенности. Например, частичные суммы разложения по ортогональному базису могут не обладать свойствами плотности вероятности, и для обеспечения выполнения этих свойств нужно принимать специальные меры.

Для аппроксимации плотности вероятности, определенной на всей числовой оси (—го; +го) , используются

системы ортогональных функций, которые также определены на всей числовой оси, такие как функции Эр-мита, тригонометрические и другие [1]. Оценка плотности вероятности в таком случае записывается следующим образом:

т

СМ (Х) = ГРмЩк (Х,Х) , (1)

I

N,

к=0

где N - объем выборки (длина дискретной реализации случайного процесса);

щ (х) , к = 0,1, 2,... - полная система функций, обладающих следующим свойством ортогональности

Г0, к Ф п; щ (Х,а)щп (Х,«)Л = • 2 , ;

[И , к = п.

X - масштабирующий коэффициент, Вм к ” оценки для коэффициентов разложения по ортогональному базису. Эти оценки рассчитываются следующим образом : для проекционной оценки [2]

В = — Г Щк (Х‘) (2)

для гистограммно-аппроксимационной оценки, которая основана на сглаживании полигона частот, построенного по выборке [3]

1 го

Рм,к = й—и I /р (хЩк (Хх)^ , (3)

—го

где ср (х) - полигон частот.

Однако для решения поставленной задачи возможно использование систем ортогональных функций, определенных на полуоси [0; +го), например, функции Лагерра, Лежандра, Дирихле [1]. В этом случае оценка плотности вероятности запишется следующим образом: т тл

См(Х) = Ъ(Рм,к)пЩ (Х — Х0)1(Х — Х0) + Г(рмк)лЩ (Х0 — Х) 1(Х0 — х), (4)

к=0 к=0

где Х0 - точка, в которой плотность не равна 0, например, точка максимума полигона, построенного

по реализации; т , т - число слагаемых в аппроксимирующих суммах для правой и левой ветвей;

Г1 , при х > 0;

1(х)=•^ - единичная функция.

[0, при х < 0.

Коэффициенты разложения рассчитываются по следующим формулам: для проекционной оценки

(я \ (в щ(х0 х)

(Вм,к )п дт Г || ||2 , (Вм , к )л дт Г || ||2 ,

■^4 т\\ м^л т\\

где

/п - множество тех значений индекса л_, при которых выборочные значения х( е(х0; +го) ; /л

множество тех значений индекса л_, при которых Х( Е(—го;Х0] .

^ го ^ Х0

(рм,к)п = =-р-1Ср(Х)щ(х-—А)* , (Вмк)л==17 1 Ср(Х)щ(Х0~Х,ал)Ах •

для гистограммно-аппроксимационной оценки

, 1.р; 0 (б)

Щк\\ Х0 Щк\\‘ —ГО ' '

При этом выражение для погрешности аппроксимации примет вид:

(т„ т„ \

А= I/2 (х) ах — Ё 1Ы12 (рмк )2+Г 1Ы12 (р=)2

... Ч_ , | (7)

==== к=0

где С (х) - оцениваемая кривая. Для проекционной оценки это /у ( х) - теоретическая плотность

вероятности, для гистограммно-аппроксимационного оценивания это Ср (х) - полигон частот.

Как уже отмечалось, построенные оценки плотности вероятности (1), (4) могут не обладать основными

свойствами плотности вероятности. Преобразование этих оценок к плотности вероятности (неотрицательность и равенство площади под кривой единице) описано в [1,3].

В большинстве случаев оценка (4) не обладает свойствами непрерывности и гладкости. Такая ситуация может возникнуть в случае неравных масштабирующих параметров для отдельных ветвей или различного числа элементов в сумме ряда.

Для устранения разрыва оценки в точке склеивания правой и левой ветвей нужно обеспечить выполнение следующего равенства, верного и для проекционных, и для гистограммно-аппроксимационных оценок:

тп тл

)щк(°,х„)^(^.к)лЩ(0,хл) • (8)

к=0 к=0

Отметим, что используемые в равенстве (8) коэффициенты (ЪМ,к )

п(л)

должны минимизировать квадратиче-

скую погрешность аппроксимации, обеспечивать выполнение свойства нормировки плотности распределения вероятностей [3], а также обеспечивать «склеивание» аппроксимирующих правую и левую ветви функций в точке разделения. Применим метод множителей Лагранжа для расчета коэффициентов Ъкп , Ьк л . Получим:

1 А1Б2 — А2Б1 /л л -----к-2--щ(0, Хп);

(9)

К,п =(&а)п - А2Б22 Ы(°,ап)І

А3А1 А2

К

Б1А3 А2Б2

АЛ -А,2

(—і (0, “л )/

2| |^-| | АзА1— А22 1 А, Бл — А^Бл

где Б1 =

)П1Ы |2 (—і (0,“п)) + ПЛл )Л1И |2(—і (0,“л))—1

Б2 =

"‘п "‘Я

Т,(Рм,к )п і(0, “п) — £(Рм,к )л і(0, “я)

А, =

2ІПІ N12 (—і(°,“п))2' + 2Ё1И12 (—і (0,“л))2'

А2 =

2(—і(0,“п))' і(0,“п) — Х(—і(0,“л))' і(0,“л) /=0 /=°

- і=0

На рисунке 1 изображены примеры устранения разрыва оценки плотности вероятности с использованием формулы (9). Коэффициенты разложения обеспечивают склеивание правой и левой ветвей оценки и минимизируют среднеквадратическую погрешность аппроксимации (7). Аппроксимация проводилась в базисах Ла-герра (рис. 1а), 1б) ) и Лежандра (рис. 1в), 1г) ) . Отметим, что если аппроксимация проводится в

базисах, определенных на всей числовой оси (например, Эрмита (рис. 1д), 1е) ), то пересчет коэффици-

ентов для склеивания аппроксимирующих кривых не требуется.

Если использовать данную методологию, то при аппроксимации правой и левой ветвей плотности вероятности С (Х), определенной на всей числовой оси, в точке «склеивания» х0 ветвей может возникнуть излом (см. рис. 1). В тех случаях, когда известно, что искомая плотность вероятности является гладкой функцией, или когда с практической точки зрения целесообразно получить гладкую оценку См(Х)

плотности вероятности, необходимо обеспечить «гладкое склеивание» достичь соблюдением следующего равенства:

зетвеи в точке

Этого можно

(х)

dx

или

(х)

х=хо —0

йх

(10)

=Х0 + 0

а) гистограммно-аппроксимационная оценка с разбиением в базисе Лагерра без «склеивания»

б) гистограммно-аппроксимационная оценка с разбиением в базисе Лагерра со «склеиванием»

+

х

0 •

в) гистограммно-аппроксимационная оценка с разбиением в базисе Лежандра без «склеивания»

г) гистограммно-аппроксимационная оценка с разбиением в базисе Лежандра со «склеиванием»

0,32 -0,3 -0,280,260,240,22 -0,2 0,180,16 -0,14 0,12 -0,1 0,080,06 0,040,020-

-2 -1 0 1 2 3 4 5 6

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

д) проекционная оценка в базисе Эрмита

е) гистограммно-аппроксимационная оценка в базисе Эрмита Рисунок ї - «Склеивание» аппроксимирующих функций

d

E(bN.t )nh (x-—0.«n )

dx

l(bN.k)лhk(X0 ~—.«л)

dx

x_x0 +0

(11)

t_ xo —0

Кроме выполнения равенства (11) коэффициенты разложения (Ъ^к) , (Ъ^А) должны обеспечивать минимум

квадратической погрешности и склейку аппроксимирующих кривых в точке разбиения с одновременным выполнением основного свойства плотности вероятности. Найдем их, используя метод множителей Лагранжа.

Ь (в ^ В1Г22 — Г12В2 ( щ (0 X )) — (0 Хп) В2Г11 Г21В1

Ъ^п = В)п-ТТ^—К-К(щ(0,Хп)) ■ Г22ГП — Г21Г12

Г22 Г11 Г21Г1

— P(i.«n) Г В3 В1Г22 ~ Г12В2 ■ А31 В2Г11 ~ Г21В1 ■ А32

2|h|| О Г22Г11~ О О 2 О Г22Г11 ~ ОО A33

Ь.л _ (Bn, )л - (-hi(0.«л)) +

ВГ(( Г1(В( і ,-ґ\ „ h(0.«л) ■ В(Г11 Г(1В1 + (12)

Г((Г11 Г(1Г1(

Р(‘.«Л) I В3 В1Г22 Г12В2 А31 В2Г11 Г21В1 A3;

(|hi|| lA33 Г22Г11 Г21Г12 A33 Г22Г11 Г21Г12 A33

где Б1 _

2innN.k )J|hk||2 (“hi (0. «n ))t + 2!{nN.k )Jhk|| 2(-hk (0.«л ))kl

All

(ZW |2 (-h* (° ))2k+(k л ||2 (n (° «л ))2

ko

A12 _ _

"л

1(—hk(0.«n)) hk(0.«n)— Z(—hk(0.«л)) hk(0.«л) k=0 k=0

mn тл

Ї (-hk(0 «n пП^, «n) - 2 (л (0 «л) f k(k «л) ko ko

n "л

in ( nN. k )nhk (0 . «n ) — і (В k )д hk (0 . «л )

k=0

A22

^23 = A3( =

1 -y P(k. «n )hk (0 . «n ) . 1 * P(k . «л )hk (0. «л ) О 2 II l|( О 2 II l|(

llhl

Б3 = 1» )„ P(k «n )-I^k )Л P(k «л )

Л «) impfe«)

33 2ko Ikkl2 +k0 hk

g А3Б3

. 1 A33 _

Л23Б3

Б,

Г,, =

, А,

/1 A13A32

A12

4 A(3A31

A(1 4

Л( —:

+

Б( =

а Р(к ,“п( л)) =

й {ік ( х,“п( л)))

йх

и зависит от своИств ортогонального базиса.

х=0

На рисунке 2 приведены примеры устранения излома в точке склеивания аппроксимирующих ветвей для гистограммно-аппроксимационных оценок плотности вероятности в базисах Лагерра и Лежандра. Аналогичная картина имеет место и для проекционных оценок.

а) Гистограммно-аппроксимационная оценка с разбиением в базисе Лагерра со «склеиванием»

б) Гистограммно-аппроксимационная оценка с разбиением в базисе Лагерра с « гладким склеиванием»

в) Гистограммно-аппроксимационная оценка с разбиением в базисе Лежандра со «склеиванием»

г) Гистограммно-аппроксимационная оценка с разбиением в базисе Лежандра с «гладким склеиванием»

Рисунок 2.3 «Гладкое склеивание» аппроксимирующих выражений

Следует отметить, что построенные оценки обладают свойством непрерывности, гладкости и являются плотностями вероятностей. Проведенные исследования показывают, что обеспечение «гладкого склеивания» аппроксимирующих выражений может сопровождаться некоторым увеличением погрешности аппроксимации.

Предложенные алгоритмы «склеивания» и «гладкого склеивания» позволяют получить непрерывные и гладкие оценки плотности вероятности с сохранением ее основных свойств (неотрицательность и равенство площади под кривой единице), а также минимизировать квадратическую погрешность аппроксимации с учетом перечисленных свойств.

ЛИТЕРАТУРА

1. Абрамовиц М., Стиган И. Справочник по специальным функциям. - М.: Наука, 1979. - 832 с.

2. Деврой Л. , Дьерфи Л. Непараметрическое оценивание плотности. Ь1 - подход. Пер. с англ. - М.: Мир, 1988. - 408 с

3. Дегтярева О.А. Оценивание плотности вероятности в ортогональных базисах с учетом свойств плотности вероятности. / Материалы научно-практической конференции «Инновации в условиях развития информационно- коммуникационных технологий». - М.:МИЭМ, 2006. - 484 с.

Аппроксимация гладких плотностей вероятности в ортогональных базисах, определенных на полуоси Текст научной статьи по специальности «Математика»

Похожие темы научных работ по математике , автор научной работы — Дегтярева О. А.

Текст научной работы на тему «Аппроксимация гладких плотностей вероятности в ортогональных базисах, определенных на полуоси»