УДК 519.7
А. В. Лапко, В. А. Лапко
АНАЛИЗ АСИМПТОТИЧЕСКИХ СВОЙСТВ МНОГОМЕРНОЙ НЕПАРАМЕТРИЧЕСКОЙ РЕГРЕССИИ*
ности случайной величины х через р(х), а кривую регрессии у по х - через ф(х):
ф (х)= | У Р [-1 dy.
V х
Будем считать, что плотность вероятности р(х) известна. В качестве приближения по исходным статистическим данным кривой регрессии примем статистику
Фі (х )=■
і
п к
р(х )Пс
,=1
-ІП®
( і \ х, - х.
(і)
Исследуются асимптотические свойства многомерной непараметрической регрессии, синтез которой основан на оценках плотности вероятности Розенблатта-Парзена. Устанавливается их количественная зависимость от вида ядерной функции и особенности исходных статистических данных.
Ключевые слова: непараметрическая регрессия, восстановление зависимостей, асимптотические свойства, ядерная функция.
Непараметрическая регрессия, основанная на оценках плотности вероятности типа Розенблатта-Парзена [1; 2], использовалась при восстановлении однозначных стохастических зависимостей по статистическим данным наблюдений их переменных [3].
Для этой регрессии был разработан ряд модификаций в условиях малого [4], большого [5] объема статистических данных и при обработке неоднородной информации [6]. Непараметрическая регрессия является основным элементом структуры гибридных моделей, решающих правил оценивания состояния статических систем и временных процессов [7]. Уже установлены условия асимптотической сходимости непараметрической регрессии и ее модификаций, однако полученные результаты не позволяют определить количественную зависимость показателей эффективности исследуемых статистик от их параметров и особенностей априорной информации. Эта проблема усугубляется тем, что непараметрическая регрессия является оценкой условного математического ожидания. Нелинейный характер ее зависимости от непараметрических оценок плотностей вероятности случайных величин создает трудности при количественном анализе ее асимптотических свойств.
Исследование аппроксимационных свойств непараметрической регрессии значительно упрощается, если априорная информация содержит сведения о виде плотности вероятности аргументов восстанавливаемой зависимости. Такие сведения могут быть получены в результате предварительной обработки исходных статистических данных либо при их формировании в процессе активного эксперимента с исследуемым объектом. Цель данной статьи состоит в анализе асимптотических свойств многомерной непараметрической регрессии в зависимости от вида ядерной функции при известной плотности вероятности аргументов восстанавливаемой зависимости.
Непараметрическая регрессия и ее асимптотические свойства. Пусть V = (х1, у1, 1 = 1, п) - выборка, составленная из п независимых наблюдений слу-(х = (, ^ 1 к) у)
вероятности р (х, у). Обозначим плотность вероят-
чайной величины
где ядерные функции Ф (иу) удовлетворяет условиям Н:
ф(и„ ) = Ф(-и„ у, 0 <Ф(х )<<»,
|ф(и„ )йЦ, = 1, | и2 Ф(и„ )й?и„ = 1,
|и'т Ф(иу)ёиу < да, 0 < т < да; V = 1, к ,
а их коэффициенты размытости cv = су (п) ^ 0 с ростом п. Здесь и далее бесконечные пределы интегрирования опускаются.
При синтезе статистики ф1 (х) используется непараметрическая оценка р (х, у) многомерной плотности вероятности р (х, у) типа Розенблатта-Парзена [1; 2].
Для получения аналитически значимых результатов при исследовании свойств непараметрической регрессии будем считать, что интервалы изменения значений компонент хЛ), V = 1, к , вектора х одинаковы. В этих условиях появляется возможность полагать одинаковыми значения коэффициентов размытости с„ = с, V = 1, к, ядерных функций. Тогда непараметрическая регрессия (1) запишется в виде 1
Ф (х )=-
(2)
с плотностью
пс р (х) 1=1 v=1
Асимптотические свойства ф (х) определяются
следующим утверждением.
* Работа выполнена при поддержке гранта ФЦП «Научные и научно-педагогические кадры инновационной России, на 2009-2013 гг.», ГК № 02.740.11.0621.
Теорема. Пусть ф (x), p (x, y), p (x) Ф 0 и первые две их производные по каждой компоненте xv, v = 1, k , ограничены и непрерывны; ядерные функции <&(uv) удовлетворяют условиям H; последовательности c = c (п) коэффициентов размытости ядерных функций такие, что при п ^да значения с ^ 0 , а nck ^да. Тогда непараметрическая оценка регрессии ф (х) обладает свойствами асимптотической несмещенности и состоятельности.
Д о к а з а т е л ь с т в о. По определению имеем
M(ф(х))= k1 ( )х
пс p(x)
п k f x _ ’I
x]l J-J У П ®| ^
1=1 v=1
p (x)
/
xv -1,
p ,у1, xl, —, x\ )у1 dx\ ... dx\ =
p(у, ^-,tk))^і -dtk =
TT I-1Ф(t )П Ф
p(x)
\'2)
к к
Е Е ф'^’М p'2-'(x)
v=1 r=1
4 p (x)
■ Е ф^ (x) p{() (x) I uv4 Ф(Uv ) duv + 0 (c6 ) ,
v=1
Для доказательства состоятельности оценки ф (х) вычислим ее дисперсию
Б ((х)) = М (ф(х) - ф (х))2 - ( (ф(х) - ф (х)))2 . (5)
Исследуем асимптотические свойства среднеквадратического отклонения:
M ( Ф (x)- Ф (x ))2 =
■M (2 (x))- 2 ф(x)M (у (x)) + ф2 (x).
(б)
Следуя ранее использованной технологии исследований, проведем преобразования:
M
M2 ,x))
1
2 2к 2 n C ~
p,x)
Em (у) П
Ф2
V j j
1=1 j=l j *1
ЕЕ" у1 ПФ у1 ПФ
л. ..л л
V /
J
xv tv ''p(tl,-,%)dtl-dtk, (3)
2 2/ 2 ( )[nI-1Ф2 M,•••,h) :
72 C2кp2 (x)L J J
где М - знак математического ожидания. При выполнении данных преобразований учитывается, что элементы статистической выборки V являются значениями одних и тех же случайных величин (/, у)
с плотностью вероятности р(у, Ц,..., 1к).
Проведем в выражении (3) замену переменных (xv - tv) с-1 = иу, и разложим функции
ф (х„ - ctv, V = 1, к), р (xv - с(, V = 1, к | вряд Тейлора в точке х. Тогда с учетом свойств Н ядерных функций при достаточно больших значениях п получим асимптотическое выражение смещения непараметрической регрессии
М ((х)- ф (х)) ~,с() Е (ф (х) р (х))('
Пф 2
2 I xv - tv
-J Р (t1,-, tk )dt1 - dtk +
+n (n _ 1))J-J ф (^..., tk ) х
хП °f xv-tL 1 p (^-, tk )dt1 - dtk
v=1 v c J Пренебрегая величинами малости 0
0' c6), найдем значение асимптотическо-
го выражения
m(ф2(x))~ф2(x) + к1, )ф2(x)
v ’ nc p(x)
ЩФ 2 (uv )duv
v=1
4p2(x)
Е (ф (x) p(x )l
V v=1
,'2)
(4)
где ф^(х), pV2^ (х), ((х) р (х))(2) - вторые производные функций ф (х), р(х) и их произведения по компоненте х^,; символом 0 (с6) обозначены слагаемые степени малости порядка с6. Отсюда, из условия с ^ 0 при п , следует свойство асимптотической несмещенности непараметрической регрессии ф (х).
v=1 r =1
r *v
Е Еф(2)(x)p(2)(x) +Ефу2)(x)py2)(x)Iuv4ф(uv)duv
v=1
(7)
Подставим выражения (4) и (7) в (6) и при достаточно больших п получим
M (ф (x)- ф (x))2 ~ -лгттП Iф 2 (uv )duv
nc^p (x) v=1
4 p2 (x)
Е'ф (x) p(x))
V v=1
1=1
v=1
v=1
4
4
+
Отсюда, с учетом соотношений (4) и (8), из условия с ^ 0, пск при п следует свойство состоятельности непараметрической регрессии ф (х).
При к = 1 результат (8) совпадает с утверждением работы [8], что подтверждает корректность выполненных преобразований.
Анализ аппроксимационных свойств статистики ф (х). На основании полученных аналитических результатов установим количественную зависимость аппроксимационных свойств ф (х) от вида ядерной
функции и особенностей исходных статистических данных.
Определим минимальное значение W2 выражения
П|ф2 (и,)Ли„
пс
|... | ф2 (х) р 1 (х) ^х1... ёхк +
4
2
| ••• Ц р-1 (х )Ё(ф (х) р (х)) ёх1 ••• ёхк, (9)
V V=1 У
которое получено путем интегрирования результата (8).
Из условия минимума (9) по коэффициенту размытости с нетрудно получить его оптимальное значение
( к у/(к+4)
кА П|Ф2 (и,)dUv
*
с =
пВ
где
А = ]"••• |ф2 (х) р 1 (х) ёх1... ёхк;
к
В=1 ••• II р-1 (х)Е(ф(х)р(х))(2) ^•••йхк.
У-1
(2)
Тогда, подставляя с* в выражение (9), получим
^4 -|1/(к+4)
А П|Ф2 (и,)<Ч
=
Вк
4 + к
4 кк/(к+4)
. (10)
Ф 0 (иV ) =
3
3и,,
г г V Ы ^^,
4^5 20л/5 1 1
0 V |и^ ^ л/5.
Для исследования влияния вида ядерных функций на аппроксимационные свойства многомерной непараметрической регрессии определим отношение
^2 (Ф(и))
W2 (ф0 (и))
где W2 (Ф0 (и)), W2 (Ф(и)) - значения критерия W2
(10) при ядерных функциях Ф0 (и), Ф(и). При этом
по каждой компоненте и^,, V = 1, к , использовались следующие ядерные функции:
ф(и, ) =
V |и,| >Тб; Ф(и, ) = (2 п)-1/2 е-иА 1
ф(и, ) =
273 V N ^
0 V |и,; I >73,
(11а)
(11б)
(11в)
(11г)
Нетрудно убедиться, что в данных условиях при Ф(иу,) = Ф(и) и Ф0 (uv) = Ф0 (и), V = 1, к , отношение
Я2 = а4к/ (к+4),
где
| Ф2 (и )ёи
а =
| Ф2 (и )<іи
Значения а приведены в работе [2].
Результаты вычислительных экспериментов при исследовании зависимости отношения Я2 от количества к аргументов восстанавливаемой зависимости и вида ядерных функций представлены в таблице.
Зависимость отношения Я2 от количества к
аргументов восстанавливаемой зависимости и вида ядерных функций
Дополнительно уменьшить значение W2 можно за счет минимизации выражения | Ф2 (^) бич по виду
ядерной функции Ф(и) с учетом выполнения условий Н.
Подобная задача решена в работе [2], в которой получена оптимальная форма ядерной функции
Ф(и) к = 1 к = 3 к = 5 к = 7 к = 9
(11а) 1,012 1,026 1,034 1,039 1,042
(11б) 1,041 1,089 1,117 1,135 1,148
(11в) 1,061 1,136 1,179 1,208 1,228
(11г) 1,249 1,61 1,853 2,027 2,157
С ростом размерности к вектора аргументов восстанавливаемой зависимости возрастает влияние выбора вида ядерной функции на аппроксимационные свойства многомерной непараметрической регрессии, что проявляется в увеличении значений отношения К2. Такая тенденция особо характерна для ядерных функций Ф(и) и Ф0(и), которым свойственны
,=1
4
большие значения а. Например, отношение R2 для ядерной функции (11а) при k = 9 равно 1,042, а для (11г) - 2,157. При этом соответствующие им значения а равны 1,015 (11а) и 1,32 (11г).
На основе анализа асимптотических свойств многомерной непараметрической регрессии определена количественная зависимость ее аппроксимационных свойств от вида ядерной функции и особенностей статистических данных. В условиях их достаточно большого объема вид ядерной функции оказывает значимое влияние на среднеквадратическое отклонение непараметрической регрессии от условного математического ожидания, которое возрастает с увеличением размерности аргументов восстанавливаемой зависимости. Данная закономерность особо проявляется с увеличением степени отличия ядерной функции от оптимального ядра Епанечникова.
Библиографические ссылки
1. Parzen E. On Estimation of a Probability Density Function and Mode // Annu. Math. Statistic. 1962. Vol. 33. P. 1065-1076.
2. Епанечников В. А. Непараметрическая оценка многомерной плотности вероятности // Теория вероятностей и ее применения. 1969. Т. 14, вып. 1. С. 156-161.
3. Надарая Э. А. Замечания о непараметрических оценках плотности вероятности и кривой регрессии // Теория вероятностей и ее применения. 1970. Т. 15, вып. 1. С. 139-142.
4. Лапко В. А., Бадмаев Р. В. Синтез и анализ нелинейных непараметрических коллективов решающих правил в задачах восстановления стохастических зависимостей, основанных на последовательных процедурах формирования решений // Вестник КрасГАУ. 2006. № 10. С. 53-62.
5. Лапко А. В., Лапко В. А., Варочкин С. С. Коллектив непараметрических регрессий, основанных на принципе декомпозиции обучающей выборки // Вестник СибГАУ. 2009. Вып. 1 (22). Ч. 2. С. 38-40.
6. Лапко А. В., Лапко В. А., Суханов А. В. Непараметрические восстановления стохастических зависимостей в условиях пропуска данных // Проблемы автоматики и управления : науч.-техн. журн. Нац. акад. наук Кыргыз. Республики. 2005. С. 74-81.
7. Лапко В. А. Непараметрические коллективы решающих правил. Новосибирск : Наука, 2002.
8. Обучающиеся системы обработки информации и принятия решений / А. В. Лапко, С. В. Чен-цов, С. И. Крохов, Л. А. Фельдман. Новосибирск : Наука, 1996.
A. V. Lapko, V. A. Lapko
THE ANALYSIS OF ASYMPTOTIC PROPERTIES OF MULTIDIMENTIONAL NONPARAMETRIC REGRESSION
Asymptotic properties of multidimensional nonparametric regression, synthesis of which is grounded on estimations of a probability density of Rosenblatt-Parzen, are explored. Their quantitative dependence on flavor of kernel function and features of initial statistical data is determined.
Keywords: nonparametric regression, restoring of dependences, asymptotic properties, kernel function.
© Лапко А. В., Лапко В. А., 2012
УДК 631.331
Г. Н. Лимаренко, М. В. Шевчугов, А. Н. Щепин
К РАСЧЕТУ ДИНАМИКИ УСТАНОВИВШЕГОСЯ ДВИЖЕНИЯ ВЫХОДНОГО ЗВЕНА
В ВОЛНОВОЙ РЕЕЧНОЙ ПЕРЕДАЧЕ
Приведены результаты теоретических исследований и методов расчета в поступательном приводе с волновой реечной передачей неравномерности установившегося движения его выходного звена - роликовой рейки, взаимодействующей с многокулачковым механизмом.
Ключевые слова: толкатель, диаграмма, фазовый сдвиг, приведенный момент инерции, динамическая ошибка скорости.
Волновая реечная передача (ВРП) с роликовой рей- таким, чтобы в зацеплении с роликами рейки одновре-
кой [1] основана на взаимодействии многокулачкового менно находилось не менее двух толкателей. Это тео-
вала с толкателями, контактирующими с выходным ретически обеспечивает линейность функции положе-
звеном - рейкой на линейных участках диаграмм ния выходного звена, малые изменения характеристики
их относительного движения. Количество толкателей приведенной жесткости и равномерное распределение
в механизме преобразования движения выбирается движущих сил по промежуточным звеньям.