Научная статья на тему 'Локальные полиномиальные оценки условных функционалов и их производных по независимым наблюдениям'

Локальные полиномиальные оценки условных функционалов и их производных по независимым наблюдениям Текст научной статьи по специальности «Математика»

CC BY
117
37
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
функционалы от условного распределения / линейная локальная аппроксимация / условные асимптотические моменты

Аннотация научной статьи по математике, автор научной работы — Китаева Анна Владимировна

Предложены оценки подстановки функций функционалов от условных распределений (условных функционалов) и их производных. В качестве элементов подстановки взяты локальные линейные оценки, построенные по независимым наблюдениям. Рассмотрены их асимптотические свойства: найдены условные смещения и дисперсии. Определен также порядок скорости сходимости в среднеквадратическом четвертых условных моментов отклонений оценок.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Китаева Анна Владимировна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Estimates of functions substitution of conditional functionals and their derivatives have been proposed. Local linear estimates made by independent observations are taken as substitution elements. Their asymptotic properties are examined conditional biases and variances are determined. Convergence rate in mean square estimate deviations of the forth conditional moments is also defined.

Текст научной работы на тему «Локальные полиномиальные оценки условных функционалов и их производных по независимым наблюдениям»

Управление, вычислительная техника и информатика

УДК 519.2

ЛОКАЛЬНЫЕ ПОЛИНОМИАЛЬНЫЕ ОЦЕНКИ УСЛОВНЫХ ФУНКЦИОНАЛОВ И ИХ ПРОИЗВОДНЫХ ПО НЕЗАВИСИМЫМ НАБЛЮДЕНИЯМ

А.В. Китаева

Томский политехнический университет E-mail: [email protected]

Предложены оценки подстановки функций функционалов от условных распределений (условных функционалов) и их производных. В качестве элементов подстановки взяты локальные линейные оценки, построенные по независимым наблюдениям. Рассмотрены их асимптотические свойства: найдены условные смещения и дисперсии. Определен также порядок скорости сходимости в среднеквадратическом четвертых условных моментов отклонений оценок

Ключевые слова:

Функционалы от условного распределения, линейная локальная аппроксимация, условные асимптотические моменты.

1. Введение. Постановка задачи

В условиях недостаточности априорной информации об объекте, что, как правило, и имеет место на практике при моделировании сложных систем, можно воспользоваться непараметрическими методами. В этом случае для всестороннего исследования объекта проводится идентификация в широком смысле [1, 2], т. е., например, определяется степень связи между входными и выходными переменными, что можно сделать с помощью функций чувствительности в регрессионной модели, находится остаточная дисперсия и т. д.

Данная работа посвящена развитию идеи единого подхода к идентификации в широком смысле стохастических систем в условиях априорной неопределенности [3]. В качестве модели берется функция регрессии, минимизирующая среднеквадратическое отклонение истинных выходов объекта и модели. Регрессионный анализ является одним из самых распространенных методов изучения зависимостей, к примеру, практически вся эконометрика основана на исследовании регрессии [4].

В [5] отмечена важная роль условных функционалов в практических приложениях, более того, все примеры, приведенные в статье (функция регрессии, функция чувствительности, условная дисперсия, куртическая и скедастическая кривые), либо прямо являются условными функционалами и их производ-

ными, либо представляют собой функции от них. Поэтому с содержательной точки зрения вместо оценок базовых функционалов а[х)=Щу)Лу,х)йу, г=1,5+1, &+^1 и их производных, введенных в [5], представляется целесообразным сразу же рассматривать оценки условных функционалов

ь (х) = а (х)/ р( х) = ц (х) / а +1 (х) =

= j gi (У) f (УI x)dy, i = 1,5

(1)

и их производных, которые в [5] рассматривались как характеризационные.

Здесь применяются без дополнительных пояснений обозначения, введенные в [5].

Таким образом, взяв за основу условные функционалы, в дальнейшем будем рассматривать функции

J (х) = а({Ь(х)}, {Ь^(х)}, / = 1~), (2)

где Ьу( х) =

dbt (х) dx

Заметим, что отказ от рассмотрения оценок функции регрессии и функций чувствительности, как оценок подстановки в рамках идеологии работ [3,5], позволяет получить более естественные оценки, обладающие лучшими асимптотическими свойствами в среднеквадратическом смысле.

Приведем еще два важных примера применения выражений вида (1) и (2): при gi(y)=I(Y<y), где ДО - функция-индикатор, соответствующий условный функционал представляет собой условную функцию распределения; отношение

| У~‘/(У I х)СУ

минимизирует среднеквадратиче-

| У ~2 / (У1 х)СУ ское относительное отклонение [6].

Будем рассматривать одномерный случай (т=1).

Классические ядерные оценки типа Надарая-Ватсона функционалов (1) (оценки подстановки базовых функционалов, рекуррентный аналог которых использован в [5], формула (7) при к;к=к„) имеют вид

£ я,- (X,) к

Ьп (х) =-

£ к

( х - X} к

а п(х) Рп (х) ’

для оценивания Ь(1)(х) в [5] предлагается брать оценку подстановки производной Ь;(х).

Оценки Ь;н(х) можно рассматривать как частный случай оценок аНн (при а¡1)=...=осi(p)=0), удовлетворяющих условию

(

£

к)

-£аа

V к = 1

(X, - х)к

К

( х - X Л

Ш1П .

—(к)

(а а а ] )

(4)

' я1 (У1)Л

Г’ 3 = } , Л =

V Яа ( Уп ) )

(

Введем обозначения 1 Х1 - х 1 Х2 - х

1 X, - х

(X1 - х)

(X 2 - х)Р

(X, - х)Р

,р Л

Заметим, что если ядро К(.) задано на компакте, что и будем предполагать, то матрица D не вырождена с вероятностью, стремящейся к единице при нкн^ж. Теоретически проблема может быть решена и для ядра, заданного на Я, например, гауссовского, однако с практической точки зрения выбор финитного ядра оправдан [13].

Из (4) следует

а,

= е^Б-ЛтКО,,

а,) = ет(к) Б- ЛтКО],

к = 1, р.

(5)

Рассмотрим случай р=1 (линейная локальная аппроксимация). Тогда из (5) следует

У(2) - 5(1)(X, - х)

1

пк

£ к

к

Я,(У, )-

У (0) - (у (I))2

(6)

,= 1, у, (3) где у

(,)

=— £ к

пк “1

(X,- х) .

Заметим, чтобы оценить Ь(1)(х), ]=1^ следует взять коэффициент при (Х—х), полученный по критерию (4), - аН(1), и, вообще, чтобы оценить производную к-го порядка (к<р)Цк)(х) следует взять а^к!. Таким образом, мы получаем единый естественный подход к оцениванию условных функционалов и их производных любого порядка.

Оценки функции регрессии (^(х)=х) вида (4) впервые были рассмотрены в [7], (до этого они использовались в анализе временных рядов) и изучались в [8-10]. Обсуждение достоинств этих оценок можно найти также, например, в [11, 12].

2. Асимптотические свойства оценок условных функционалов и их производных

Воспользуемся методологией, предложенной в [9], и найдем условные смещение и дисперсию оценок ан (при условии Х1=х1,...,Хн=хн), т. к. при усреднении по переменной X возникают проблемы, связанные с возможностью обращения в нуль знаменателя в (6), которые можно решать различными способами, в частности, при помощи кусочногладкой аппроксимации [14] или, просто добавляя к знаменателю слагаемое н~2 [15].

Введем определение. Пусть (4) и (пн) - последовательности случайных величин, определенных на вероятностном пространстве (0,ДР).

Определение. Будем говорить, что последовательность (4) бесконечно мала по сравнению с по-

ние: 4=о„(п„)), если для V е > 0 Р

( 4 л

V Пп )

^ 0

при н^да; последовательность (4) ограничена по сравнению с последовательностью (пн) по вероятно-

сти (4=0 (г1н)), если Vе > 0 Зу,N: Р

>7

для Vн>N.

В леммах 1-5 будем считать, что весовая функция К(.) - ограниченное ядро-плотность, заданное на компакте, причем все его начальные моменты нечетного порядка (нам будет достаточно моментов первого и третьего порядков) обращаются в нуль. Заметим, что для выполнения последнего условия достаточно взять симметричное ядро, что является вполне естественным для задач ядерного оценивания. Существование всех моментов ядра (как и ин-

е(Щ - вектор размерности (р+1)х1, состоящий из тегралов } К 2(х)Сх и } х2К2(х)с1х, рассматривае-

нулей, кроме к+1-ой компоненты, равной 1,

кпК = сНая

К ^

V V к,

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

D=ATKA.

мых далее) следует из ограниченности ядра, заданного на компактном носителе.

,=1

,=1

Лемма 1. Пусть функция Ь(х) дважды непрерывно дифференцируема, функция плотности распределения р(х) непрерывно дифференцируема в точке х, р(х)^0, последовательность (кн)—0. Тогда при н—ж

Ьшя, = Е(а п(х)X = х!,...,Xп = хп)-Ь (х) =

1 ж

= 2ь,(х)К I х2К(х)Сх + Ор (кп2). (7)

Доказательство. Из (6) следует

Е (ап (х)| X1 = хр..., Xп = хп) =

1

пк

£ к

( х - х Л

(х, -х)Ь,(х,)

У(2) - 5(1)

Разложим функцию Ь() в ряд:

Ь,(х,) = Ь,(х) + (х, -х)Ь](х) + 2(х - х)2й/(х) +... Тогда

Ыая, =

= е^Б-1 ЛТК

' Ь, (х)

Ь'Ах) .

V 14 V

((х1 - х)2 л

(хп - х)2

Ь 1(х) + ...

-Ь,( х) = 2 Ь,( х)е(о)ТБ-1 ЛТК

(хп - х)2

+.... (8)

При р=1

-Б = п

( с(0) о« Л

„(1) „(2)

)

-ЛТК

п

((х1 - х)2 л

(хп - х)2

( „(2) Л

5(3)

Для у=0,1,2,3

кп | х1 К(х)Схр(х) + орк) при 1 = 0,2;

„(1) =^

К11 х+'К(х)СхР(х)+ор(кп+1) пРи1= 1,3. (9)

Отсюда, при р(х)^0, следует пБ-1 =

( 1 р'(х)

рм -Ор(1)

+ Ор(1)

р (х)

2( ) 'Ор (1) р (х)

1

к^р(х) | х2К(х)Сх

■ Ор (К2)

(10)

Обозначим

Р,к (х) = ЕЯ (7) Як (У)\Xl = х1,..., X, = х,) --Ь1( х)Ьк(х)

Ф,к = С,аЯРк (х1Х-^к (хп )).

Найдем условные ковариации

еоу(а,п(х), аы(х)|Xl = х^..., Xп = хп), к,1= 1,

Лемма 2. Пусть функция рк(х) непрерывна в точке х, р(х) непрерывно дифференцируема в точке

х, р(х)^0, 11ш(Кп +1/(пкп)) = 0. Тогда при н—ж

п——ж

С0У(а,п (х),акп ( х)\X1 = х1,-> ^ = хп ) =

ж

I К2(х)сжр,к(х)

-+ О„

( 1 Л

V пкп )

пкпр (х)

Доказательство. Из (5) следует

С0У(ащ (х),а*п (х)|X1 = х1,..., X = хп )

= е(0)ТБ-1 ЛТ К Ф ¡кКЛБ~ 1е(0).

Рассмотрим

(11)

(12)

—ЛТ К Ф ,кК4 = п

=йк!т(Л

=р( х)р,к(х) *

К1 I К2(х)Сх + Ор (к-1) I хК2(х)Сх + 0р (кп )

| хК2(х)Сх + 0р(кп) кп | х2К2(х)Сх + 0р (п-1)

(13)

Подставив (10) и (13) в (12), получаем при (кн+1/(нкн))—0 то, что и требовалось доказать.

Рассмотрим свойства оценки а-н1)(х) производной Ь'(х) в линейной локальной аппроксимации.

Лемма 3. Пусть функция Ь(х) имеет непрерывную третью производную, функция плотности распределения р(х) непрерывно дифференцируема в точке х, последовательность ( кн)—0. Тогда

Ь,а1 = Е(<(х)| Xl = х1 >..., X = хп) - Ь(х) =

ж

ь"'(х) Iх"к(х)Сх

Подставляя полученные результаты в (8), получаем то, что и требовалось доказать.

Обратим внимание на то, что смещение оценки ан„(х) в отличие от Ьн(х) [14] не зависит от Ь'(х), в частности, если функция Ь() линейна (ЬДх)=0), то скорость сходимости смещения увеличивается.

I х2К(х)Сх

Ь" р’ (х)

2 р( х)

I х4К(х)сСх

ж

I х2К(х)Сх

I х2К(х)Сх

к2 +

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

+Ор (к„).

(14)

Доказательство. Из (5) следует (р=1, к=1)

Е(а1 (х)|X1 = хр..., Xn = хп) = е(Т)Б-1ЛТЩ , (15)

( Ь. (х1) Л

где В. =

Ь (х )

V .Л п/)

. Разложим Ь/х) в ряд

1

Ь,(х,) = Ь (х) + (х, -х)Ь'(х) + -(х -х) Ь’’(х) +

1

+б(х, - х) Ь,(х) +...

(16)

Подставляя (16) в (15), учитывая (10), получим

= е(1)ТБ-1 ЛТК

(Ь,(х)Л 1

+

2

3 Л

((х1 - х)2 Л

Ь' (х)

V 1 4 -V

(хп - х)2

Ь 1 (х) +

1

+

6

(х1 - х)

Ь 'X х) +...

= е(1)ТБ-1 ЛТК

(хп - х)3, -Ь1( х) = ((х - х)2 Л

Ь1(х)+

1

+

6

(хп - х)2

((х1- х)3 Л

(хп - х)3

=е(1) х

( “Г)+ Ор(1) р(х) р

р'(х)

+ Ор (1)

р'(х) р( х)2

+ Ор (1)

к2р(х) I х2К(х)Сх

+ Ор (К1)

пК, I I х2К(х)Сх

Доказательство аналогично доказательству леммы 2. Найдем

соу(а® (х), аы (х) | Xl = хр..., Xn = х,)

(будем считать выполненными условия леммы 2 и дополнительно 11ш1/(пк2) = 0 ):

п—ж

п С0V(а1n) (х), акп ( х)| X1 = х1,..., X = хп) =

= пе(1)ТБ- ЛТК Ф 1кКЛБ-1е(0) =

Р (х) р( х)2

■ Ор (1)

к^р(х) I х2К(х)Сх х р( х)Р1к(х) х

( -ж ж Л

К11к2(х)Сх+Ор(к;1) ]"хК2(х)Сх +0, (кп)

I хК2 (х)Сх + 0р (кп) кп I х2К2 (х)Сх + 0р (п-1)

( 1

р( х) р'( х)

Ор (1)

+ Ор (1)

К р( х)

р (х)

I хК2(х)Сх I х2К(х)Сх

+ Ор (кп_2)-

( „(2 „(3) Л

----Ь 1 (х) +---Ь1( х) +...

2 6 1

„(3) „(4)

----Ь 1 (х) +---Ь "(х) +...

V 2 1 6 1 у

Принимая во внимание (9), получаем при (кн)—0 то, что и требовалось доказать.

Лемма 4. Пусть функция рк(х) непрерывна в точке х, р(х) непрерывно дифференцируема в

точке х, р(х)^0, 11ш(кп + 1/(пкп3)) = 0. Тогда

п—ж

С°У(«1п)( х); акШ( х)\X1 = х1>-> Xn = хп ) =

1 I х К2(х)Сх рк(х)+ Ор 1-0. (17)

ж р(х) I пк„)

Заметим, что если К(.) - симметричная функция, то

соу(а(п)(x), акп(х)|X1 = xl,..., Xn = хп) = Ор(п

Рассмотрим поведение условных четвертых моментов статистик анп(х)=а^0’(х) и а^х), что надо для исследования свойств оценок подстановки функций (2). Обозначим

Sln = аЦ(х) -Е(О)(х)|X1 = х1,...,Xn = хп), 0(() = = КЛБ-1е(1)е(,;Б-1ЛТК = (^,,,] = Щ),

/ = 0,1, (3 - В])(0] - В1)Т = с =

= (Ск = (Я1(У,) -ЬСУ))(Я/Ук) -Ь1(УкЛ ^ к =1 п). Лемма 5. Пусть

Е((яД) -Ь/х))4|X1 = хр...,Xn = х,) <ж,

р(х) непрерывно дифференцируема в точке х, р(х)^0, 11ш(кп + 1/(пкп'+1)) = 0. Тогда при н—ж

п—ж

Е(Б^\X1 = х1,...,Xn = х,) = 0р (п-\2*+\ Доказательство. Из (5) следует

Е^(,)4|X1 = х1;...,X = х ) =

^1^ 1 15 5 п п '

= Е(е(1)ТБ-ЛТКС<2(СКЛБг\) X1 = хр...,Xn = х ).

Пусть t=0. Учитывая (10), получаем

( (х хЛ (х хЛЛ

K

n2Q <0> =

1

K

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

V hn у

( хп - х Л

(х1 - х) K

(Xn - х) K

V V П у

V hn у

( Xn - х Л

v hn у у

( 1

, + Op (1) (1)

p’(х) pW p>(х) p' '

£!£.+Op (1) (£Mi+Op (1)

V^ (х) p (х) у

p (х)

K i ^ хЛ

V К у

(х ,л

p (х)

K

( хп - х Л

v hn у

(х1 - х) K

V hn у

(хп - х )K

( хп - х Л

V hn уу

Итак,

ATKE (CQ(0)C|X1 = х1,Xn = хп )KA = 1

п hn

I

p ,y,k ,m=1

pykm

I (лу - х)д

p,y ,k ,m=1

pykm

I (х, - х)арг1<т I (х,- х)(хp - х)аиЫ

Vp,y,k,m=1 py ,k,m=1

х - х Л ( х - х

a^,km = K | -p-----------IK

pykm

XE(Cpm9kmCky |X1 = х1,--- = Xn = хп )-

(18)

Если среди индексов ц у, к, т есть хотя бы один отличный от остальных, то Е(сыдктск)Х1=х1,...,Хн=^н)=0 в силу независимости выборочных значений, и главные члены в матрице (18) дают попарные совпадения индексов, при этом все суммы превращаются в двойные. Выделяя главные части, аналогично (9), получим при н—ж

к, ЛТКЕ (С0 (0CX1 = х1,..., Xn = х, )КЛ =

= 'с + Ор (1) 0р (К,) ^

О (к ) О (к 2) ,

V р 4 п' р ^ п ' )

где с^0. Учитывая (10), получаем

Е^п|X1 = х1,...,X, = х,)4 = Ор (п-2к;2).

Случай = рассматривается аналогично. Доказательство леммы 5 закончено.

Порядок сходимости условных четвертых моментов отклонений, равный

0(п-2 к-2(1+» + к,4),

показывается аналогично доказательству леммы 7 [16].

Интересно отметить, что степень полинома р оказывает такое же влияние на скорость сходимости смещения оценки ан функции регрессии ^(у)=у), как и параметр V в [5], показывающий минимальный порядок момента ядра, отличного от нуля: Маз^О^к^1) для нечетных р и Ыаз=0р(к„р+2) для четных р [11]. Этот результат может быть распространен и на условные функционалы общего вида (1).

n

X

X

СПИСОК ЛИТЕРАТУРЫ

1. Райбман Н.С. Что такое идентификация. - М.: Наука, 1970. -119 с.

2. Эйкхофф П. Основы идентификации систем управления. Оценивание параметров и состояния. - М.: Мир, 1975. - 683 с.

3. Китаева А.В., Кошкин Г.М., Пивен И.Г Непараметрическая идентификация в экономических системах // Обозрение прикладной и промышленной математики. - 2008. - Т. 15. -Вып. 4. - С. 588-612.

4. Айвазян С.А., Енюков И.С., Мешалкин Л.Д. Прикладная статистика. Исследование зависимостей. - М.: Финансы и статистика, 1985. - 487 с.

5. Китаева А.В., Кошкин ГМ. Полурекуррентные ядерные оценки базовых функционалов по независимым наблюдениям // Известия Томского политехнического университета. - 2008. -Т 312. - № 2. - С. 8-12.

6. Jones M.C., Heungsun Park, Key-Il Shin, Vines S.K., Seok-Oh Je-ong. Relative error prediction via kernel regression smoothers // J. Statist. Planning and Inference. - 2008. - V. 138. - № 10. -P. 2887-2898.

7. Stone C.J. Consistent nonparametric regression // Ann. Statist. -1977. - V. 5. - № 4. - P. 595-645.

8. Cleveland W.S. Robust locally weighted regression and smoothing scatterplots // J. Amer. Statist. Assoc. - 1979. - V. 74. - № 368. -P. 829-836.

9. Fan J. Design-adaptive nonparametric regression // J. Amer. Statist. Assoc. - 1992. - V. 87. - № 420. - P. 998-1004.

10. Ruppert D., Wand M. P. Multivariate Locally Weighted Least Squares Regression // Ann. Statist. - 1994. - V. 22. - № 3. -P. 1346-1370.

11. Fan J., Gasser T, Gijbels I., Brockmann M. Engel J. Local polynomial regression: optimal kernels and asymptotic minimax efficiency // Ann. Inst. Statist. Math. - 1997. - V. 49. - № 1. - P. 79-99.

12. Fan J., Gijbels I. Local Polynomial Modeling and Its Applications. - London: Chapmen and Hall, 1996. - 341 p.

13. Seifert B., Gasser T Finite sample variance of local polynomials: analysis and solutions // J. Amer. Statist. Assoc. - 1996. - V. 91. -№ 433. - P. 267-275.

14. Добровидов А.В., Кошкин Г.М. Непараметрическое оценивание сигналов. - М.: Наука, Физматлит, 1997. - 336 с.

15. Fan J. Local linear regression smoothers and their minimax efficiency // Ann. Statist. - 1993. - V. 21. - № 1. - P. 196-216.

16. Китаева А.В., Кошкин ГМ. Ядерные оценки базовых функционалов по зависимым наблюдениям // Известия Томского политехнического университета. - 2009. - Т. 314. - № 2. -С. 26-31.

Поступила 24.03.2009г.

i Надоели баннеры? Вы всегда можете отключить рекламу.