А.В.Петров
К вопросу вероятностного анализа нелинейных стохастических зависимостей
В соответствии с определениями теории вероятностей [3, с. 791] формулируется понятие момента совместного распределения случайных величин Х],...,Хп:
«Для любых целых К, >0)К1+... + Кп =К математическое ожидание М[Х^ называется сме-
шанным начальным моментом порядка К, а
M[{x1-M[xi]f:.,(x„-M[xJ-\
- центральным смешанным моментом порядка К».
И далее: «Центральный смешанный момент порядка 2 М[(Х1 - М[Х}])-(Х2 -М[Х2])] называют ковариа-цией (корреляцией)».
Уточним понятие центрального смешанного момента, В указанном определении и многих других источниках говорится, что порядок момента определяется суммой степеней К.. Это не совсем корректно, так как и корреляционный
момент {Кх = К2 = 1,К = 2) и дисперсия (К] = 2,К2 — О, К - 2) имеют один порядок 2 . Но они отличаются по определению ! Но, если речь идет о смешанном моменте, например, порядка 4, то тогда не ясно, какие значения принимает К j.
И в этом отношении совершенно правы М.Дж. Кендалл и А, Стюарт [4, с. 120], называя смешанный момент многомерным, хотя и это не точно, так как подразумевает только количество случайных величин, задействованных в смешанном моменте.
Точнее всего назвать смешанный момент Мк s = М (Х - тх )к • (Y - mY )s J моментом, имеющим "ПОРЯДОК K,S".
В дальнейшем мы будем придерживаться именно этой терминологии, называя
Мкл.....х, -(xt,x2,...,x„)=м[(х, -м(х,№ ■ (Х2-М{Х2)У',.,(Х„ -М(Х„)У-\ (1)
смешанным центральным моментом случайных величин Х1,Х2>..., Хп порядка K]>K2,...iKn.
По аналогии, имеет место и смешанный начальный момент случайных величин Х.,...,Хп порядка К],...,Кп
тк......К-{Х„...,Х„)=М[Х^-..,Х«-] (2)
Для дальнейшего рассмотрения важна теорема [9, с. 176]:
«Если - функция распределения величины <J, f(x) • непрерывная функция, то
мШ)\= ]f{x)-dFf{Xy.
-00
Из которой следует, что
- 1 °°
M\x-af J- \{x~af -dF(x).
-co
(Для дискретных и многомерных случайных величин см. [11, с, 42,44]).
Введем в рассмотрение случайную величину Хт и исследуем ее центрированный и нормированный вариант. Центрированная величина
Хт =х"'~ат(х)
центрируется относительно начального момента порядка т . Это очевидное действие, хотя бы с точки зрения размерности случайной величины X. Исходя из этой же посылки введем нормированную величину
о
X'
Для такой случайной величины
а,
( * Л
а
м\хт-а{х'
X")
в(хт)=
а.
Введем также понятие смешанного момента порядка Кх, К2 нового вида - смешанного момента порядка Кх К2 случайных величин т] -ой и т2 -ой степеней
1>тг) =
м
или для произвольного (и) числа случайных величин
[хщ -а{хт^[ \хт2 -а(хт^\
М
Хщ -а X
..... \Хт--а\Хт'
(3)
-ои степеней
а также начальных моментов порядка К1,К2,...,Кп случайных величин тл-ой, т2-ой,
ак......
Очевидно, что вновь введенные числовые характеристики охватывают при соответствующих кртп] -1,2,...,и
ранее описанные в широко распространенной научной и учебной литературе числовые характеристики случайных величин. И, вообще говоря, они не столь уже «новы». По-видимому, ранее им не уделялось особого внимания по достаточно простой причине - не ясны физические свойства, которые они отражают,
Нормированный смешанный момент порядка К1УК2,...:>Кп случайных величин в степени т1,т2,...,тп имеет
вид
(т„...,т2)
ах "
(4)
Рассмотрим один из возможных путей решения проблемы определения физических свойств случайных явлений, описываемых сложными моментами вида (3) и/или (4),
При рассмотрении задачи нахождения коэффициентов полинома п -ой степени
у = а0 + а, • х, + а2 • х52 +... + ап • хп
методом наименьших квадратов (нелинейная полиномиальная регрессия). К.Ф. Гаусс [2, с, 38], Дрейпер Н., Смит Г. [1, с. 33-38], Н.И. Идельсон [12, с, 34-40], Е,Е, Слуцкий [11, с. 42] и другие авторы (включая и авторов учебной литературы] предлагают использовать так называемые системы нормальных уравнений.
Параметры а/ определяются из условия минимума сумм квадратов отклонений (минимума среднеквадратической ошибки)
(5)
т1п! ЁЛ • (у 1 ~а0~ а*х" I
и=1 °~Х
где п - объем выборки (количество наблюдаемых пар (хуу.}у = 1,2,...,и); а) - дисперсия наблюдений независимой переменной х, ау - искомые коэффициенты.
Так как мы рассматриваем случай, когда п и сг постоянны и не связаны с индексом у , то выражение (5)
примет вид
пип
2>.
./=1
у а0 а\ ' Х/
(6)
В результате минимизации получим так называемую систему нормальных уравнений
( \ о
( \ 1
Ч V ( \
5»
V ) ) (Л }
ап +
) V
г \ \ 1 ■ J
ах + ...+
•а, + ...+
V ./ ) j
2>гк = 1>;^
V У ) }
(7)
(
а0 +
>1+\
а, +...+
V )
)
2>г
V ) У
Решая эту линейную систему, находят коэффициенты а,, доставляющие минимум среднеквадратической ошибки между наблюдаемыми значениями зависимой переменной у. и вычисляемыми значениями полинома при найденных значениях а..
Для полинома 1-го порядка система нормальных уравнений (7) принимает вид
Г \
п-а0 +
2Х
V 1 У
или (после умножения уравнений на множитель
2Х -«,=1^.
)
V У у
(8.а)
<я0 + /и/ • ^ = ту,
тх -а0 л-а-1 -ах — Кх,у, (8.6)
где знак « » означает оценку соответствующей числовой характеристики, Обратим внимание на второе уравнение (8.6) системы (8) и сформулируем следующее предположение:
1) Первое уравнение описывает смешанный момент т0,.
2) Второе уравнение - смешанный момент т{ 1.
3) Третье и все последующие - смешанные моменты т,,, где у - номер уравнения.
4) Система нормальных уравнений (7) описывает стохастические взаимосвязи зависимой переменной и независимой переменной в соответствующей степени {0-ой, 1-ой,...,п-ой),
Под термином «описывает» понимается связь соответствующего сложного смешанного момента с начальным моментом независимой переменной и коэффициентом а/ полинома, Для полинома п-ой степени найдем числовые характеристики
V „ V
V ./=0
а
(г)=м
п
7=0
0(у)=м1у-а,{гУ)\=±а)-0(
7=1
7=1
7=1
.(ам{х)-ак{х)-а1{х)) ¿а,
ГШ) - М________г_______= >!-,------------—-,К<п.
Рассмотрим подробнее центральный момент (выражение (9)) для различных К. Обозначим начальные
моменты, как а] = а,(х). Тогда при К — 1
^(м) = ~ ' а)=ал^2 ~ ал)+ ~ • а2) +... + аг,(ап+] ~агап), (10)
7=1
при К — 2
-а2-а) = ал(аъ-ага2) + а2{ссА - а22)+... +а,, (а„+2 -а2-а„)
м
и т.д.
Обратим внимание на тот факт, что в каждой сумме (10) обязательно присутствует слагаемое (когда / = К), которое является соответствующей дисперсией в(хк),
Именно в исследовании смешанных моментов высших порядков (3), описывающих нелинейные стохастические взаимосвязи и состоит фундаментальная проблема теории вероятностей, компьютерного моделирования и обработки информации. Для решения этой проблемы создается теория новых, ранее неизвестных вероятностных характеристик, описывающих нелинейные стохастические взаимосвязи, Использование новых функциональных и числовых характеристик вероятностной нелинейной взаимосвязи вообще не встречается в мировой практике.
Для решения поставленной задачи предполагается использовать статистические модели, обеспечивающие исследование стохастических взаимосвязей, регулируемых именно порядком следования реализаций случайных величин во взаимодействии с нелинейными трендами. Данный подход к изучению сложных стохастических нелинейных взаимосвязей не уступает мировому уровню, а с точки зрения технологичности при компьютерном моделировании - превосходит этот уровень,
Рассмотрим суть перестановочной технологии на простейшем примере бернуллиевского случайного процесса, Пусть Г|(0), т](1), ...- реализация некоррелированного случайного процесса (г)(1), Т—{0,1,...} при-
чем п^т^О, т^О и Р{г1(1)=к}=рк; кеК; К={0,1,...,'М}. Ограничимся при этом случаем рк^О и рк^1 для всех к.
Эта реализация порождает случайный вектор
(0),п>0.
где п - параметр упорядочения.
В качестве реализации генерируемого процесса 1еТ} Т~{0,1,...} в момент X выбирается компонент гп
вектора {V (I), 1еТ}, то есть 500=ит(Т), где индекс га определяется упорядочивающим оператором (критерием сравнения О)
ит(1) = 0К(м), 0(1)1
например, минимизацией модуля первой разности
|<?(0 ~ К (0| = -1) - и; (Г)|}, у - 1,2,..., и.
Вектор {С/(0,1еТ} формируется по правилу
UJ(t + l) = UJ(t),j
Алгоритм дополняется начальными условиями
§(0) = Т1(0)И ¿7(1) = (7(1), 77(2),..., ф)). Использование перестановочной технологии введения вероятностных зависимостей показало, что для ряда критериев сравнения (например, «минимизации модуля первой разности» или «максимизация произведений») корреляцион-
ные моменты определенно выражают форму и величину вводимой зависимости, а для ряда критериев (например, «минимизации разностей»), вводящих стохастическую зависимость по сути перестановочной методики, корреляционные моменты ее не отражают. Вместе с тем, расчет смешанных моментов вида (3) как раз и отражает наличие этой зависимости.
В табл. 1 приведены автокорреляционные функции и смешанные моменты вида (3) для различных критериев сравнения и равномерного в [-1, + !] закона распределения вероятностей случайного процесса
Таблица 1
Критерий сравнения «Минимизация модуля пер вой разности» «Минимизация произведений» «Максимизация разности»
Автокорреляционная функция «I "I :...... -- 1 | ! 1 | 1 1 с !. 1- . ! т? .............................. 1 ! • [\ Рг-^Г'Д-А.-Д .'. л" ] Ь Ц 1 ! - __________ ..... ........ — .....
.......... .................I № V/ у' г ? ■\ f--i ' - .1.......
Смешанный момент вида (4) для полинома второго порядка -«« !• '••Шк ф, Г ^ Т »' V V '.Г и"» V ':. 1. '» " ............ ....... 1 1 1 | | 1 •ж- ш 1 \ 1 1 1"" 1 ш \ 1 1 1 1
Таким образом, полученные уже на начальной стадии исследований результаты демонстрируют, что введенный новый класс числовых и функциональных характеристик способен в достаточной мере отражать нелинейные вероятностные взаимосвязи, а предлагаемый для исследований инструментарий (перестановочные технологии) обеспечивает возможность экспериментальной проверки теоретических выводов.
Библиографический список
1. Дрейпер Н„ Смит Г. Прикладной регрессионный анализ: В 2-х кн. Кн. 1 / Пер, с англ. - 2-е изд., перераб. и доп, - М.: Финансы и статистика, 1986. - 366 с. ил,
2. Гаусс К. Ф. Избранные геодезические сочинения. Т. 1, Способ наименьших квадратов. - М,: Изд-во геодезич. лит-ры, 1947, -152 с.
3. Математическая энциклопедия: Гл, ред, И. М. Виноградов, т, 3. Коо - Од, - М,; Советская энциклопедия, 1982, - 1184 стб„
ил,
4. Кендалл М, Дж„ Стюарт А, Теория распределений, - М.: Наука, 1966, - 588 с„ ил.
5. Митропольский А, К. Техника статистических вычислений. - М,: Наука, 1971. - 576 с„ ил.
6. Вентцель Е. С., Овчаров Л А, Теория вероятностей и ее инженерные приложения. - М,: Наука, 1988. - 480 е., ил.
7. боровков А, А. Теория вероятностей: Учебное пособие для вузо«. - 2-е изд., перераб, и доп. - М.: Наука, 1986. - 432 с.
8. Крамер Г„ Лидбеттер М, Стационарные случайные процессы. - М.: Мир, 1969 - 398 с,
9. Гнеденко Б, В. Курс теории вероятностей: Учебник. - Изд, 6-е, перераб. и доп. - 1988. - 448 с.
10. Бусленко Н. П., Калашников В, В,, Коваленко И. Н, Лэкции по теории сложных систем, - М,; Советское радио, 1973, - 439 с,
11. Слуцкий Е, Е, Избранные труды, Теория вероятностей и математическая статистика. - М.: Изд-во АН СССР, 1960. - 292 с.
12. Идельсон Н, И, Способ наименьших квадратов и теория математической обработки наблюдений. - М,: Изд-во геодезич, и картограф, лит-ры, 1947, - 359 с.