Научная статья на тему 'Разложение двумерных плотностей вероятностей в ортогональных базисах'

Разложение двумерных плотностей вероятностей в ортогональных базисах Текст научной статьи по специальности «Математика»

CC BY
172
60
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
АППРОКСИМАЦИЯ / ОРТОГОНАЛЬНЫЙ БАЗИС / ДВУМЕРНАЯ ФУНКЦИЯ / КОЭФФИЦИЕНТ РАЗЛОЖЕНИЯ / ПЛОТНОСТЬ ВЕРОЯТНОСТЕЙ / ДВУМЕРНЫЙ СПЛАЙН / APPROXIMATION / ORTHOGONAL BASIS / DOUBLE-DIMENSIONAL FUNCTION / APPROXIMATION COEFFICIENT / DENSITY OF PROBABILITIES / DOUBLE-DIMENSIONAL SPLINE

Аннотация научной статьи по математике, автор научной работы — Лёзин Илья Александрович

Исследован подход к аппроксимации двумерных плотностей вероятностей на прямоугольных областях с помощью семейств двумерных ортогональных функций, полученных как произведение одномерных ортогональных функций. Приводятся формулы расчета коэффициентов аппроксимации в различных базисах при первичном приближении входных данных в виде сплайна, а также величина методической погрешности при выбранных значениях коэффициентов переноса и масштаба.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Лёзин Илья Александрович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Approximation of Double-Dimensional Densities of Probabilities by Orthogonal Bases

Approach to approximation of double-dimensional densities of probabilities in rectangle areas by the families of double-dimensional orthogonal functions created by multiplication of single-dimensional orthogonal functions is studied. Calculation formulas of approximation coefficients are quoted at different bases by using primary spline approximation of input data, as well as the meaning of methodical deviation at selected values of scale and transmission coefficients.

Текст научной работы на тему «Разложение двумерных плотностей вероятностей в ортогональных базисах»

УДК 517.587:519.216

РАЗЛОЖЕНИЕ ДВУМЕРНЫХ ПЛОТНОСТЕЙ ВЕРОЯТНОСТЕЙ В ОРТОГОНАЛЬНЫХ БАЗИСАХ

И. А. Лёзин

Самарский государственный аэрокосмический университет им. ак. С. П. Королёва,

443086, г.Самара, Московское ш., 34.

E-mail: [email protected]

Исследован подход к аппроксимации двумерных плотностей вероятностей на прямоугольных областях с помощью семейств двумерных ортогональных функций, полученных как произведение одномерных ортогональных функций. Приводятся формулы расчета коэффициентов аппроксимации в различных базисах при первичном приближении входных данных в виде сплайна, а также величина методической погрешности при выбранных значениях коэффициентов переноса и масштаба.

Ключевые слова: аппроксимация, ортогональный базис, двумерная функция, коэффициент разложения, плотность вероятностей, двумерный сплайн.

При работе с большими выборками однородных данных возникает необходимость получения функциональных вероятностных характеристик, например, таких как плотность вероятностей, которые используются при анализе свойств имеющихся данных. Непрерывная функциональная модель, построенная по эмпирической выборке, позволяет перейти к аналитическим выкладкам при решении ряда задач. Например, в машиностроении, имея выражение плотности вероятностей для распределения значений дефектов отдельных деталей, можно перейти к совместной плотности узла, состоящего из нескольких деталей, и заранее оценить вероятность и величину отклонений от нормы при сборке.

Рассмотрим случай с выборкой, представленной набором двумерных данных, например, координат случайных точек на плоскости. Первичное приближение плотности вероятностей представим в виде сплайна степени р, построенного на основе двумерной гистограммы:

s(p)(x,y) = s(p)(x,y), Xi < X<Xi+i, Уз < y<yj+1, (1)

i = 0,1 ,...,N; j = 0,1,...,M,

где

s(p)(х,У) = ^ ^ a(jmVym (2)

1=0 m=0

Разложим плотность вероятностей в ряд вида

N N-n

f(x,y) = EE вnmFnm(x,y), (3)

n=0 m=0

Лёзин Илья Александрович — ассистент кафедры информационных систем и технологий.

где Fnm(x,y) —семейство функций [1, 2], ортонормированных на некоторой прямоугольной области С с весовой функцией л(х,у).

Имея выражение (1) в качестве первичного приближения, коэффициенты разложения функции в ряд вида (3) можно оценить по формуле

впт =11 8{р\х,у)Епт (х,у)^(х,у)(Іхйу. О

(4)

Однако в таком виде формула справедлива только в том случае, когда область С совпадает с областью определения сплайна В. Введём понятие функций, ортонормированных на произвольной прямоугольной области:

Рпт(х, у) =

1

Л/Ш:

п

хау

х - вх У - ву

ах

а,

1

_ р -р п

ах

х - вх

ах

1 п (У-Ру

_ Ц;

ау

ау

У(х,у) = у

х - вх У - ву

ах

ау

;х - вх \ ( у - ву

1^х[ _ ) Ц"У

ах

ау

(5)

Здесь Рп(х) и Ят(у) —семейства одномерных ортонормированных функций с весовыми функциями ^х(х) и лу(у); ах и ау — коэффициенты масштаба; @х и ву — коэффициенты переноса.

В рамках работы рассматриваются полиномы Лежандра и Чебышева первого и второго рода, определенные на интервале [—1; 1], функции Лагерра, заданные на интервале [0; то), и функции Эрмита, ортогональные на бесконечном интервале. Общий вид рассматриваемых одномерных функций указан в табл. 1.

Таблица 1

Виды одномерных функций

Базис Общий вид к-того элемента

Лежандра, ц{х) = 1 [к/2] Рк{х) = І2авХ , 8=0 „ _ ( ^2к+1 {2к-2з)\ 8 ~ ' ' л/2 2*я1(к-я)1(к-2в)!

Чебышева первого рода, ^ , [к/2] , , ад = Тк{х) = £ а3хк 8, у в=0 п — ( І'ІЯ /2 пк-2з—1 1) у п* з\(к-2з)\

Чебышева второго рода, ц(х) — л/1 — X2 [к/2] и0(х) = -2=, ик(х)= £ азХк~28, <*. = (-1

Лагерра, /х(ж) = 1 [к/2] Ь0(х) = е~х!2, Ьк(х) = £ а3х8е~х/2, аз — ( 1) (в1)2(к_я)|

Эрмита, ц(х) — 1 [/с/2] Нк(х) = £ а3хк~28е~^2, .5=0 - _ ( IV / *! 2к~2в «8-1 Ч у/ 2к^ з\(к-2з)\

Необходимо найти такие значения коэффициентов переноса @х и @у, коэффициентов масштаба ах и ау, чтобы обеспечить ортонормальность семейства функций (5) и минимум погрешности аппроксимации:

АМ2 = Ц (8(р\х,у) - /(х,у^ (1(х,у)йхйу =

Б

2 N N—п

= (^(х, у)) Кх,У)(Ыу — ЕЕ впт• (6)

^ п=0 т=0

Коэффициенты разложения в таком случае рассчитываются как

впт = JJ (х, у)Рпт(х,у)Д(х,у)(х(у.

Б

(7)

Поскольку рассматриваемые семейства (5) есть произведение одномерных функций, представленных в табл. 1, то перенос и масштабирование по каждой из осей можно рассматривать отдельно.

Коэффициенты переноса и масштаба для полиномов Лежандра и Чебышева, определённые на конечном интервале, находятся однозначно. В отличие от них, для функций Лагерра и Эрмита в общем случае можно задать лишь коэффициенты переноса, но и они могут быть выбраны почти произвольно. Значения коэффициентов масштаба и переноса приведены в табл. 2.

Поскольку для функций Лагерра и Эрмита невозможно заранее определить оптимальное значение коэффициента масштаба, коэффициенты разложения (7) в общем виде являются функциями от неизвестных коэффициентов ах и ау:

Рпт — Рпт(ах1 ау) — 1

су-х ау

Ц в(р)(х,у')Е:1

х-1% (8)

ах

ау

ах

а

Б

у

Таблица 2

Коэффициенты переноса и масштаба

Вид Коэффициенты переноса Коэффициенты масштаба

Полиномы Лежандра, Чебышева Рх = 2 (^тах “I” ^тш)> Ру = 2 (Утах Н- 2/тт) &х = 2 (^тах ^тт)) = 2 (Утах Утт)

Функции Лагерра Рх = ^тт; Ру — Утт &х = § (^тах ^пип)) &у = § (Утах Утт)

Функции Эрмита Рх = 2 (^тах “1“ ®тт)? Ру = 2 (Утах “Ь Утт) &х = § (^тах ^тт); &у = 8 (Утах Утт)

Представим интеграл (8) по всей области В в виде суммы интегралов по каждой прямоугольной ячейке:

тх — 1 ту— 1 Х1+1 У]+1 р р П П

/зи = —= £ £ / —х

л/ахау ' I I ' 4 V ах ау /

V х у г=0 ]=0 Х ^ к=0 1=0 х у

хг уу

х (9)

ах ау

Для упрощения аналитических выкладок проведем следующую замену переменных:

х — вх у — ву пг.л

хв =--------, УО =----------(10)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

ах ау

После замены переменных выражение (9) для определения коэффициентов примет вид

тх — 1 ту — 1 хО,г+1 уп,]+1 р р

"' \к/„ I а \1

*ххВ + вх

а(к1)

аг3

= 3=0 хп,г упу к=0 1=0

X Рпт(хБ, у Б Жхб ,ув )

Перейдём к раздельной записи интегралов:

(аххп + вх) (аууо + ву) х (хв (у Б • (11)

тх — 1 ту— 1 р р Хп,г+1

а(к1) I хк

ав^

г=0 j=o к=0 1=0

впт — ЕЕЕЕ аВ>% хВ Рп(хв )»х (хв )(хв х

хп,г

уп,у+1

1

X J уБЯт(ув)Ру (у Б ')(уБ, (12)

Ст\уи;н,у\

уп,у

где р р

а(п% = Е Е а^СУ^С^/Гу-1. (13)

д=к Т=1

Представим интегралы в формуле (12) как некоторую функцию от левой и правой границ:

Ь й

1хкп\а,Ъ)=1' хкРп(х)^х(х)(х, 1у1т\е,(() = !' у1Ят(у)^у(у)(у. (14)

а с

Тогда формулу (12) можно записать в следующем виде:

тх — 1 ту— 1 р р

впт = £ £ £ ^аВ% ,ув.т).

г=0 j=o к=01=0

Для полиномов Лежандра — Ь

!ь:п)(а.Ь}^хк1 £ а,х'-2’

[п/2]

хК I Е аяхп~гз | (х =

в=0

\п/2\ а . .

_______________I ^п—2в+к+1 0й—2«+^+1 \

п-2з + А; + 1\ /

8=0 4 7

Для остальных видов функций из табл. 1 интегралы вычисляются аналогичным образом.

В зависимости от вида выбранного семейства ортонормированных функций значения интегралов (14) подставляются в формулу (12) для вычисления коэффициентов разложения. Коэффициенты (Зпт, рассчитанные для выбранных значений ах, ау, вх и ву, следует использовать в откорректированной формуле (3) разложения аппроксимируемой функции в ортогональный ряд:

N N—п N N—п в в

КХ,У) = Е Е вптРпт(х,у) = Е Е /а а Рп{~^х а У

гу гу гу гу \/ахау 4 ах / 4 ау

п=0 т=0 п=0 т=0

Погрешность (6) восстановления исходной функции в большой степени зависит от выбора коэффициентов масштаба. Для семейств ортогональных функций Лагерра и Эрмита оптимизация значений коэффициентов проводится через поиск минимума функции погрешности:

N М / тх — 1 ту — 1 р р

кп) ( хг вх хг+1 вх

1М / 1тх 1 у и и п п

ЕЕ Е Е ЕЕ^4‘">(^.5±^)

п=0 т=0 \ г=0 j=0 к=0 1=0 х х

т(1т) ( Уз ~ ву У3+1 ~ ву\

у V а ’ а„ )

2

х„.т) Ц ^шш

ау ау

Начальное приближение коэффициентов ах и ау задается по данным, представленным в табл. 2, а затем осуществляется поиск минимума функции двух переменных по методу Ньютона.

Приведённые результаты легли в основу разработки программного комплекса, используемого для восстановления двумерных плотностей вероятностей по выборкам в ортогональных базисах. Имитационное моделирование, проведенное для апробации полученных результатов, показало, что среди базисов на отрезке [—1; 1] полиномы Чебышева первого рода обеспечивают наилучшую сходимость. Семейства функций Лагерра и Эрмита также показывают хороший результат восстановления для некоторых видов плотностей (Лагерра— для плотностей, близких к экспоненциальному закону, а Эрмита — близких к нормальному закону распределения). В общем случае разложение неизвестной плотности в ортогональный ряд обеспечивает лучшее приближение плотности вероятностей, чем построение по гистограмме билинейного или бикубического сплайна. При этом ортогональный ряд не является кусочно

склеенным и требует хранения меньшего количества рассчитанных коэффициентов. А в отличие от параметрических моделей плотности ортогональная модель инварианта к виду аппроксимируемой характеристики.

БИБЛИОГРАФИЧЕСКИЙ СПИСОК

1. Муха В. С. Анализ многомерных данных: Монография. — Мн.: Технопринт, 2004. — 368 с.

2. Суетин П. К. Ортогональные многочлены по двум переменным. — М.: Наука, 1988. — 384 с.

3. Фихтенгольц Г. М. Курс дифференциального и интегрального исчисления: В 3-х томах. — М.: Физматлит, 2006. — Т. 2. — 864 с.

Поступила в редакцию 24/Х/2008; в окончательном варианте — 13/11/2009.

MSC: 93B40, 42C05, 33C45

APPROXIMATION OF DOUBLE-DIMENSIONAL DENSITIES OF PROBABILITIES BY ORTHOGONAL BASES

I. A. Lyozin

S. P. Korolyov Samara State Aerospace University,

34, Moskovskoye sh., Samara, 443086.

E-mail: [email protected]

Approach to approximation of double-dimensional densities of probabilities in rectangle areas by the families of double-dimensional orthogonal functions created by multiplication of single-dimensional orthogonal functions is studied. Calculation formulas of approximation coefficients are quoted at different bases by using primary spline approximation of input data, as well as the meaning of methodical deviation at selected values of scale and transmission coefficients.

Key words: approximation, orthogonal basis, double-dimensional function, approximation coefficient, density of probabilities, double-dimensional spline.

Original article submitted 24/X/2008; revision submitted 13/II/2009.

Lyozin Iliya Alexandrovich, Assist., Dept. of Information System and Technology.

i Надоели баннеры? Вы всегда можете отключить рекламу.