А.В.Петров
О характеристиках взаимосвязи случайных величин
В соответствии с определениями теории вероятностей [3, с. 791] формулируется понятие момента совместного распределения случайных величин XХп:
«Для любых целых К/ >0,К,+... + Кп - К математическое ожидание ХЦ" \ называется сме-
шанным начальным моментом порядка К, а
м[(х,-м[х, ])«<,.. .{х„-м[х„у-\
- центральным смешанным моментом порядка К».
И далее: «Центральный смешанный момент порядка 2
м[(х,-м[х1})-(х!-м[х1])]
называют ковариацией (корреляцией)».
Уточним понятие центрального смешанного момента, В указанном определении и многих других источниках говорится, что порядок момента определяется суммой степеней К,, Это не совсем корректно, так как и корреляционный
момент (К, = К2 = 1, К — 2), и дисперсия (К, = 2,К2 =0,К = 2) имеют один порядок 2. Но они отличаются по определению ! Однако, если речь идет о смешанном моменте, например, порядка 4, то тогда не ясно, какие значения принимает К . Ив этом отношении совершенно правы М.Дж.Кендалл и А.Стюарт [4, с. 120], называя смешанный момент многомерным, хотя и это не точно, так как подразумевается только количество случайных величин, задействованных в смешанном моменте, Точнее всего назвать смешанный момент
Мкя ~ м[(Х- тх У - (У - ту )ь ] моментом, имеющим "ПОРЯДОК К,5 " В дальнейшем мы будем придерживаться именно этой терминологии, называя
Мк,ж,.....-(ЗД.....хп)=м[{х,-м{х1))к'\х2-м{х2))к' :.,{Х„-М{Х„)У"\ (1)
смешанным центральным моментом случайных величин X¡,Х2,...,Хп порядка К,,К2,...,Кп .
По аналогии, имеет место и смешанный начальный момент случайных величин XХп порядка ККп
Щ,.....к,-{Х„...,Х„) = м[х^,.,Хкп-\. (2)
Для двух случайных дискретных величин X, и X2 в [5, с, 87] даны выражения (1) и (2) в следующей форме (в рамках принятых выше обозначений):
= ■(*/(/,ЬМ*,])*' {'Ы-М^гУ (3)
.),=' 12 = 1
71=172=1
где Р ^ - вероятность одновременного осуществления событий (X, - х1{]1)) и (Х2 = х2 (у 2)),
Раскладывая (3) в ряд при различных К1 и К2, найдем следующее соотношение между смешанными центральными и начальными моментами:
Мк к = У, У. И Г"-'---г---Х-Мк-,к * ■<„■<,■
81=1 Я2=1
В [7] предлагается и другое выражение:
К к
7,=1 72=1
Нормированные смешанные центральные моменты
гк,л2
Мк,,к2
к, к, сг ' -О •
в [7] называют смешанными основными моментами, не имеющими размерности (единиц измерения). Для дальнейшего рассмотрения важна теорема [9, с. 176]:
«Если F^(x) - функция распределения величины £, f(x) - непрерывная функция, то
Из которой следует, что
-00
м[(х - а)к ]= j(* - а)к • dF{x).
(Для дискретных и многомерных случайных величин см. [11, с. 42, 44]),
Введем в рассмотрение случайную величину Х"! и исследуем ее центрированный и нормированный варианты. Центрированная величина
Xм = хт-ат(х)
центрируется относительно начального момента порядка т. Это очевидное действие, хотя бы с точки зрения размерности случайной величины X. Исходя из этой же посылки введем нормированную величину
о
■"И'
Для такой случайной величины
( * Л
Хт =
ст\
¡фуФ-чИгВД
о{х")=а2т-а1
Введем также понятие смешанного момента порядка КпК2 нового вида - смешанного момента порядка К,,К2 случайных величин т,-ой и т2-ой степеней
М{КУ;] = м[(хт' - а(хт> ))К' ■ (Хт> - а{хщ
или для произвольного (и) числа случайных величин
.....тп) _
= М
(хт>-а(хщ))К>-...-(хт»-а(х'
(4)
а также начальных моментов порядка К1,К2,...,Кп случайных величин т,- ой, т2- ой..... тп -ой степеней
«к......ж. =м[х^-х^,.,хк„'\.
Очевидно, что вновь введенные числовые характеристики охватывают при соответствующих к],м],] = 1,2,...,п
ранее описанные в широко распространенной научной и учебной литературе числовые характеристики случайных величин. И, вообще говоря, они не столь уже «новы». По-видимому, ранее им не уделялось особого внимания по достаточно простой причине: не ясны физические свойства, которые они отражают.
Нормированный смешанный момент порядка К,, К2,..., Кп случайных величин в степени т1>т2>...,тп имеет
вид
(т, ,...,т-,) _ ! гр..
ъ......
Рассмотрим один из возможных путей решения проблемы определения физических свойств случайных явлений, описываемых сложными моментами вида (4) и/или (5).
При рассмотрении задачи нахождения коэффициентов полинома п -ой степени
у = а0 + а] ■ х] + а2 • х22 +... + ап • хп
методом наименьших квадратов (нелинейная полиномиальная регрессия). К.Ф.Гаусс [2, с. 38], Н.Дрейпер, Г.Смит [1, с. 33-38], Н.И.Идельсон [12, с. 34-40], Е.Е.Слуцкий [11, с, 42] и другие авторы (включая и авторов учебной литературы) предлагают использовать так называемые системы нормальных уравнений.
Параметры а, определяются из условия минимума сумм квадратов отклонений (минимума среднеквадратической ошибки)
т*п ' {у./ ~ао -а\х., ---апх") (6)
где п - объем выборки (количество наблюдаемых пар (х/ у /)] - 1,2,...,п)\ ст2г - дисперсия наблюдений независимой переменной х, а, - искомые коэффициенты,
Так как мы рассматриваем случай, когда п и ст2х постоянны и не связаны с индексом у , то выражение (6) примет вид
Ш1П
результате минимизации получим так называемую систему нормальных уравнений
( \ ( \ ( \
IX •а0 + I*; I*; ап=Их"гУ.г
V } ) Ч У .1
( \ ( \ ( \
2>; •а0 + •а, +. . + I *г 'ап = Их'-у
V ./' У к у Ч 1 У
(7)
( \ ( Л ( \
к •а0 + I>г •а1 + ...+ 2>Г
Ч } У V 1 У V .1 У
Решая эту линейную систему, находим коэффициенты а/, доставляющие минимум среднеквадратической ошибки между наблюдаемыми значениями зависимой переменной у. и вычисляемыми значениями полинома при найденных значениях а, .
Для полинома 1-го порядка система нормальных уравнений (7) принимает вид
/ Л
п-ап +
5Х
V
( \ IV )
а0 +
или (после умножения обоих уравнений на множитель
У ./
V -/ У I
1
(8)
а0 + т.х ■а1 = ту, тх -а0 + <22 - а, ~ Кх.у,
где знак « » означает оценку соответствующей числовой характеристики. Обратим внимание на второе уравнение системы (8) и сформулируем следующее предположение:
1. Первое уравнение описывает смешанный момент т0 ,,
2. Второе уравнение - смешанный момент т1,.
3, Третье и все последующие - смешанные моменты т ,, где / - номер уравнения.
4, Система нормальных уравнений (7) описывает стохастические взаимосвязи зависимой переменной и независимой переменной в соответствующей степени [0-ой, 1-ой,...,п-ой),
Под термином «описывает» понимается связь соответствующего сложного смешанного момента с начальным моментом независимой переменной и коэффициентом а/ полинома. Для полинома п-ой степени найдем числовые характеристики
V
а
(т)=м
7=0
7=0
Я(г)= м[(г - а, (г)2 )]=!>] А*1)-
7=1
=м[{хк -а{х"))-(¥-аМЬ1^ '«Л*)-
(9)
(К.]) _ у-1 г(и) - —
V»
Рассмотрим подробнее центральный момент (выражение (9)) для различных . Обозначим начальные мо-
гы как а . = а/(х). Тогда при .К = 1
7=1
при К — 2
7=/
и т.д.
Обратим внимание на тот факт, что в каждой сумме (10) обязательно присутствует слагаемое (когда ) - К), которое является соответствующей дисперсией
Рассмотрим примеры.
Пример 1. Полином 1-го порядка [п = 1).
(ли)
у = а0 + а1 -х, (у)= а0 + ах • а,, 0(У) = а^й(х),
а
Ни)
а\ 'ак+1 ~ак ' а\ ' а\ ~а1 - а, - а
оск+1 а, ■ ^
а«
оМ-ар}'
При К = 1 - гЙ>=(+1)
2
при К = 2 - г$>=(±1).
ОС Л *
«•1 2
при АГ = 5 - г(М=(+1).
аА - а, • а
1 ^з
0.1)
Пример 2, Полином 2-го порядка (/7 = 2).
= <я0 + ах • х + л2 • х, ,
а](У) = а0 + я, •а] + а2 •а2,
£>(У)=а,2 -0(х)+а22 -ф2)-
2
\а;+к ~ак ■а,)=аХах+к -а, -ак)+а2(а2+к -а2 -ак),
./=|
(и)
(12)
я, •(< •а к) \ + а2 • I [а2 + к - 2 а2~ 'ак)
1 УФ')- к • 0(х)+а22 ■ 0(Х2) \
При К — 1 - гДО = '(а2 -(^3 •^2) = д»' (ог2 - СУ,2)+ а2 • (ог3 - от, - )
Л2-1
(и) *(х2)-у№-й(х)+а*-0(Х2У
1 \ _1_1_/_\ ^_I____ 1 \ С_I /_<6 \ ^ _I_Ь /
-В(Х)+а\ -В{Х2)\ <т{х)-^Щх)+а]-0{х2)'
при К = 2 - г.
(2,1) _ а, -(а3 - а, -а2)+ а2 • (<*4 )
я, -I [«4 - - а ! -а3) + а2 • I [а5 -а2 • а у)
-И ч 'а,2 • Э(Х) \+а\-0(хг) I
при А^ = 5 -
Рассматривая примеры 1 и 2 (которые можно продолжать и далее) и обращая внимание на выражения (10)-(12),
(к 1)
описывающие сложные центральные моменты /ф ¡у, можно сделать вывод, что эти моменты (даже порядка 1,2) определяют "вклад" каждого компонента полинома в статистическую зависимость. Первый компонент описывает вероятностную зависимость определенным слагаемым полинома со степенью независимой переменной 1, второй - степенью 2, третий - степенью 3 и т.д.
Важно помнить, что знаменатель в коэффициенте г^у - это всего лишь НОРМИРОВКА, которая обеспечивает удобство работы, удобство интерпретации, но физической сути момента не меняет!
Найдем момент ¿¿¡¿'¡I, используя понятие биноминального ряда [14, с. 92].
= -атУ-(У-а{¥))
= М
\J•^
иг-«:-) ±4±(-
\\
л7=1
I-111+1
/=1
а
т ))
сс,
а
Используя биноминальный ряд, можно получить выражение для момента
./ = ! /=0
х\
т
\
V \Л1 /у
Библиографический список
1. Дрейпер Н., Смит Г. Прикладной регрессионный анализ: В 2-х кн. Кн. 1 / Пер, с англ. - 2-е изд., перераб. и доп. - М.: Финансы и статистика, 1986. - 366 с.
2. Гаусс К. Ф. Избранные геодезические сочинения. Т. 1. Способ наименьших квадратов. - М.: Изд-во геодезич. лит-ры, 1947. - 152 с.
3. Математическая энциклопедия: Гл. ред. И. М. Виноградов, Т, 3. Коо - Од. - М.: Советская энциклопедия, 1982. - 1184 стб.
4. Кендалл М. Дж„ Стюарт А. Теория распределений, - М,: Наука, 1966. - 588 с.
5. Митропольский А. К, Техника статистических вычислений. - М.: Наука, 1971. - 576 с,
6. Вентцель Е. С., Овчаров Л. А. Теория вероятностей и ее инженерные приложения. - М.: Наука, 1988. - 480 с.
7. Боровков А, А. Теория вероятностей: Учебное пособие для вузов. - 2-е изд„ перераб. и доп. - М.: Наука, 1986. - 432 с.
8. Крамер Г., /Ччдбеттер М. Стационарные случайные процессы. - М.: Мир, 1969 - 398 с,
9. Гнеденко Б, В. Курс теории вероятностей: Учебник, - Изд, 6-е, перераб. и доп. - 1988. - 448 с.
10. Бусленко Н. П., Калашников В. В., Коваленко И, Н. Лекции по теории сложных систем, - М.: Советское радио, 1973. - 439 с.
11. Слуцкий Е. Е. Избранные труды. Теория вероятностей и математическая статистика. - М.: Изд-во АН СССР, 1960. - 292 с.
12. Идельсон Н. И. Способ наименьших квадратов и теория математической обработки наблюдений. - М.: Изд-во геодезич. и картограф. лит-ры, 1947. - 359 с.