Научная статья на тему 'Кумулянтный метод определения закона распределения'

Кумулянтный метод определения закона распределения Текст научной статьи по специальности «Математика»

CC BY
615
118
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
КУМУЛЯНТНЫЙ МЕТОД / ЗАКОН РАСПРЕДЕЛЕНИЯ / МОМЕНТЫ СЛУЧАЙНЫХ ВЕЛИЧИН / КУМУЛЯНТЫ СЛУЧАЙНЫХ ВЕЛИЧИН

Аннотация научной статьи по математике, автор научной работы — Безуглов Д. А., Швидченко С. А.

Разработан новый кумулянтный метод определения закона распределения, позволяющий полностью автоматизировать процесс определения вида закона распределения результатов измерений. Правильность гипотезы может быть проверена в дальнейшем с помощью известных критериев, например Колмогорова или Стьюдента. Приведен пример реализации метода.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Безуглов Д. А., Швидченко С. А.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Кумулянтный метод определения закона распределения»

ТECHNOLOGIES

His

Кумулянтный метод определения закона

распределения

Разработан новый кумулянтный метод определения закона распределения, позволяющий полностью автоматизировать процесс определения вида закона распределения результатов измерений. Правильность гипотезы может быть проверена в дальнейшем с помощью известных критериев, например Колмогорова или Стьюдента. Приведен пример реализации метода.

Ключевые слова: кумулянтный метод, закон распределения, моменты случайных величин, кумулянты случайных величин.

Безуглов Д.А., Швидченко С.А.,

Ростовский технологический институт сервиса и туризма ЮРГУЭС Северо-Кавказский филиал Московского технического университета связи и информатики

Под задачей идентификации закона распределения наблюдаемой случайной величины понимается нахождение такого закона, который бы в статистическом смысле не противоречил имеющимся наблюдениям. Практика использования нормального закона распределения для описания ошибок средств измерения, как выясняется [1, 5], не всегда оправдана. В основе измерительных приборов и систем лежат различные физические принципы, различные методы измерений и различные преобразования измерительных сигналов. Погрешности измерений являются следствием влияния множества факторов, случайного и неслучайного характера, действующих постоянно или эпизодически. Поэтому понятно, что только при выполнении определенных предпосылок (теоретических и технических) погрешности измерений достаточно хорошо описываются нормальным законом распределения.

При автоматизации обработки результатов измерений рассматривается задача идентификации закона распределения случайных величин, которая обычно решается с применением статистических критериев согласия Пирсона, Колмогорова, Колмогорова-Смирнова, омега-квадрат. Задача выбора закона распределения для данной выборки значений случайной величины решается в этом случае как задача приближения функции на заданных аналитических законах распределений. В качестве закона распределения выбирается такое распределение, которое находится на минимальном расстоянии (в качестве которого может быть выбрана статистика Пирсона, Колмогорова и др.) от эмпирического закона распределения, построенного по соответствующей выборке. Выбор числовых параметров законов распределений выполняется на основе обработки всех данных единственной выборки случайной величины, в то время как при использовании

критериев согласия параметры требуется определять по иной выборке значений случайной величины.

Однако недостатком всех рассмотренных выше подходов является то, что гипотеза о виде распределения определяется эмпирически. То есть исследователь должен по виду полученной функции распределения вероятностей - эмпирической функции распределения или гистограммы, исходя из своего опыта, определить теоретический закон, которым она описывается.

Целью данной работы является разработка кумулянтного метода идентификации вида закона распределения на базе анализа результатов измерений. В дальнейшем правильность гипотезы может быть проверена с помощью известных критериев, например Колмогорова или Стьюдента.

1. Кумулянтный анализ

Кумулянтное описание случайных величин дает столь же полное их статистическое представление, сколь и моментное, оно обладает, вместе с тем, важными и привлекательными преимуществами [3]. Первое преимущество заключается в том, что кумулянты, в отличие от моментов имеют четко выраженный самостоятельный статистический смысл и могут быть заданы в определенной степени независимо друг от друга, являясь в этом плане некоторыми "нормальными координатами" статистического описания. Это приводит, например, к тому, что различные статистические средние "выходов" нелинейных преобразований выражаются простым образом именно через кумулянты "входных" переменных [3, 5].

Второе преимущество кумулянтов связано с тем, что учет их высших порядков позволяет просто описать любую степень негауссовости случайных величин. По этой причине основную ценность кумулянтное описание имеет именно для негауссовых переменных [2,5].

Cumulant method of determination of the distribution law

Bezuglov D.A., Shvidchenko S.A.,

Rostov Institute of Technology Service and Tourism of the State educational institution of higher professional education "South-Russia State University of Economics and Service" North-Caucasian branch of the Moscow technical university relationship and informatics

Abstract

A new Cumulant method for determining the distribution law, which allows to fully automate the process of determining the form of the distribution of measurement results. The correctness of the hypothesis can be tested further by using the known criteria, such as Kolmogorov or Student. An example of the method.

Keywords: Cumulant method, distribution law, moments of random variables, cumulants of random variables.

High technologies

in Earth space research - -

№ 1-2011

ш

ТЕХНОЛОГИИ

Третье преимущество кумулянтного описания случайных величин обусловлено тем, что конечному набору кумулянтов всегда соответствует некоторая вещественная функция, аппроксимирующая вероятностное распределение. Это обстоятельство имеет особо важное значение при приближенном представлении вероятностных распределений тех случайных величин, для которых можно отыскать лишь конечные наборы кумулянтов [5].

2. Кумулянтный метод анализа результатов измерений

Рассмотрим сущность предлагаемого метода. Характеристическую функцию можно записать в виде 0(м) = ехр(/?(;/)), где, очевидно, должно быть /?(0) = О Разложим функцию /3(и) в степенной ряд [3]:

00 V

д«)=1п ад=£%>)*• (1)

к-\

Коэффициенты этого ряда:

Хк=гк0к4о)=г

дг 1пв(г<) с/гА

(2)

и=0

так же, как и моменты, являются характеристиками распределения и носят название кумулянтов или семиинвариантов. Таким образом, характеристическую функцию можно представить в виде:

&(и) = ехр

Е^-о)4

к=1к-

(3)

Кумулянты однозначно определяют случайную величину, если ряд (3) сходится для всех И . Поэтому набор кумулянтов Х\>Хг->Хъ> Хз' также может служить тождественным представлением закона распределения.

Если известны моменты а^, то кумулянты могут быть найдены из следующих соотношений [4,5]:

х[ = а{ = т ; х\=а'1- Ц )2 = В \

%Ъ=аЪ~ За\а~> + (2а| '

х\ =а\ -3 Ц)2 -41а[Ц +12(а|)2<4 -6(а|)4;

х[ = а'5 -5а{а'л-\0а'2а'3+20(а{)2а'3 +

+ 30 а{(а'2)2

60 (а/)3 «2 +24(а,'')5

+ 360(й'{)4О'2 — 120ССГ] )б-

Верхним индексом г в дальнейшем будем обозначать принадлежность моментов и кумулянтов к тому или иному распределению. В выражении (4) мы использовали только шесть первых кумулянтов. Это связано с тем, что как показали проведенные авторами исследования на различных выборках, такого количества кумулянтов достаточно для раскрытия сущности предложенного подхода. Однако при алгоритмической реализации предложенного метода число кумулянтов может быть увеличено.

В аналитическом виде моменты распределений могут быть вычислены через производящую функцию. Рассмотрим для примера выражения для моментов гаус-совского, равномерного и экспоненциального законов распределения. В дальнейшем эти выражения мы используем для подстановки в (4) и определения кумулянтов соответствующих распределений.

Пусть имеется случайная величина X с распределением Р(х) ■ Тогда её производящей функцией моментов называется функция, имеющая вид:

ао

МХ(Г) = Е

(5)

где Е[*] - оператор математического ожидания.

Моменты случайной величины вычисляются через производящую функцию следующим образом [4]:

Для закона Гаусса с распределением

Р(х) = -

1

,ехр(-

(7)

ол/2я * 2 сГ производящая функция моментов будет иметь вид:

Мх (Г) = ехр(///

ст т

(8)

Соответственно, моменты могут быть вычислены в соответствии со следующими выражениями:

аг\ =т = ц) аг2 = ц2 + сг2;

г 3

аз = ц

х'6=а'6 -6а, «5 -15 а'2а'4 +30(а[)2«£ -10(сф2 + + \20а[сМъ -120(а03аз + Ща'2)3-П<Х.а\)2{с^г +

3//сг";

аг4 = И4 + 6//2сг2 + Зет4 ; аг5 = ц5 +10/Ат2 +15//сг4; агб=ц6+15/Лт2+45/Ат4+15<т6. (9)

Для равномерного закона с распределением

= а-х~ь> (Ю)

[ 0, х < а, х>Ъ. производящая функция моментов будет иметь вид:

Е\Х"\ = —М

х(0 ) = —л^акЪ

и + 1Го

к 1п—к

(П)

Соответственно, моменты могут быть найдены из следующих выражений:

ар\ = от = —(а + Ь);

2ч .

ар 2 =-(а +аЬ + Ь~); 3

ар з = — (а3 +а2Ь + аЬ2 +Ь3);

ар 4 + а^Ь + а2Ь2 + ЬЧ);

5

ар5 =-(а5 + а4 Ь + а3Ь2 + есЪ3 + аЪА + Ь5)> 6 1

ч .

ар6 = -(а6 + а5Ь + а4Ь2 + аЪЬ3 + а2Ь4 + аЪ5 + б6 ) 7

(12)

Для экспоненциального закона с распределением

Р(х) = Хе~Хх (13)

производящая функция моментов будет иметь вид:

(14)

Соответственно, моменты могут быть найдены из следующих выражений:

е 1—1 е 2

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

а 1 = от = Л ; а 2 = —г-' Я2

а з

« 6

е 24 ^ ; а 4 = —г а 5 = -

120

720

Л6

(15)

Для набора распределений вычисляются с использованием выражений (4), (9), (12), (15) теоретические значения кумулянтов. При этом при автоматизации предложенного подхода количество видов используемых распределений может быть значительно увеличено, и ограничивается лишь рамками решаемой при этом метрологической задачи.

Наукоёмкие технологии в космических исследованиях Земли № 1-2011

TECHNOLOGIES

His

RESEARCH

Пусть имеются результаты измерений Ут- Эмпирические моменты а^

могут быть найдены на основе обработки входной реализации:

ы JY

а311=^

/-1 , У Y2

¿—t т

а312

1-1

. II У,1

а31 з=- '"=°

аэг4

«Эг5 =

а316

(/-1)(/-2)' г- У F4

_га^О_.

(/-1)(/-2)(/-3)'

1м < / У F

_т=0_.

(/-1)(/-2)(/-3)(/-4)'

I £

_ш=0_

(/-1)(/-2)(/-3)(/-4)(/-5) '

(16)

где: / - размерность выборки, а31 j -

эмпирический момент ] -го порядка

/ -го закона распределения.

По ним в соответствии с выражением (4) определяются эмпирические значения кумулянтов. При этом необходимо обеспечить нормировку по второму кумулянту.

В данном случае критерием «близости» исследуемого распределения к тому или иному виду может служить следующее выражение:

' 7=1

где: 7 - вид распределения, I =1, 2, 3, - кумулянты, рассчитанные анали-

тически, % - кумулянты, рассчитанные эмпирически.

Предлагаемый метод может быть реализован, как это показано на рис. 1.

Рис. 1.1- блок вычисления эмпирических значений кумулянтов; 2 - блок вычисления

значений критерия 5; 3 - блок анализа и определения вида закона распределения; 4 - блок вычисления (хранения) аналитических значений кумулянтов

3. Пример

Для проверки метода был проведен вычислительный эксперимент. При этом использовался математический пакет МаЛсас] 1 4. Суть эксперимента состоит в следующем: с помощью датчиков случайных чисел генерировались реализации случайных чисел, распределенных по гауссовскому, равномерному и экспоненциальному законам распределения. При проведении вычислительного эксперимента размер выборки был I = 217. Сначала вычислялись теоретические значения кумулянтов в соответствии с выражениями (4), (9), (12), (15) При этом в качестве параметров законов распределений были выбраны следующие: для распределения Гаусса и равномерного распределения математическое ожидание т = 0, дисперсия Г) = 1, для экспоненциального

распределения Л — 1. Затем вычислялись значения эмпирических моментов в соответствии с выражениями (16), и значения эмпирических кумулянтов в соответствии с выражениями (4). Результаты сведены в таблицу 1.

Для каждого набора теоретических и эмпирических кумулянтов по формуле (17) вычислялись значения критерия 5, , которые сведены в таблицу 2.

Таблица 2

Значения критериев Б. для различных законов распределений

Распределение s, s2 s3

Гаусса S, =0,0024 S2= 0,55 S3 = 15028,6 5

Равномерное S,p=48,54 S2 =0,0006 S3 =13433,7

Экспоненциальное S, =15477,0 9 S2 =1541 7,4 3 S3=3,99

Рассмотрим подробно алгоритм расчета первой строки таблицы 2. Каждая строка таблицы рассчитывалась следующим образом. В первой строке мы анализируем выборку, сгенерированную датчиком случайных чисел, распределенных по гауссовскому закону распределения. Расчет ведем в соответствии со следующими выражениями, при этом используем результаты расчета теоретических и эмпирических значений кумулянтов для гауссовского, равномерного и экспоненциального законов распределения из таблицы 1.

Значения кумулянтов

Таблица 1

Закон распределения Х\ X2 Xs X6

Гауссовский Теоретические z;'= о Z'2= 1 z;=0 x\ = о zl = о

Эмпирические = -0,00071 x>> = 1,0011 X" = -°'0n „.-> _0,00082 Л4 X' = -0,0069 У - --0,047 Ль

Равномерный Теоретические zi= 0 z"=o Yp _-l,2 Л 4 xl = 0 Xl =6'88

Эмпирические Xf3 = -0,00074 X'" = Ь011 £ =0,0021 zr ="1-2 Zs" =-0,013 урэ =6,86 /L 6 '

Экспоненциальный Теоретические z;J = i x; = 6 Zl =24 Xl —120

Эмпирические X' = 0,99 x" =°<" x" =2'011 y" -6,1 1 /С 4 X' =25,024 =121,69 Л6

High technologies in Earth space research № 1-2011

His

RESEAK С 11

ТЕХНОЛОГИИ

Заключение

^ = ¿0$-хГ?\

7=1

7=1

^ = <18>

7=1

Аналогичным образом рассчитаны остальные строки табл. 2. Из приведенной табл. 2 видно что, для первого эксперимента наименьшие значение критерия 51г соответствует распределению Гаусса. Для второго эксперимента наименьшее значение критерия Б2р соответствует равномерному распределению, для третьего - наименьшее значение критерия 53г - экспоненциальному распределению.

Проведя вычисления по формулам (4), (9), (12), (15), (17) можно определить вид закона распределения, которым описывается выборка результатов измерений У ■

Разработан новый кумулянтный метод определения вида закона распределения, позволяющий полностью автоматизировать процесс определения вида закона распределения результатов измерений. Правильность гипотезы может быть проверена в дальнейшем с помощью известных критериев, например Колмогорова или Стьюдента.

Статья выполнена в рамках проекта по аналитической ведомственной целевой программе «Развитие научного потенциала высшей школы (2009-2010 гг.)» на 2009 год, подраздел 2.1.2 «Проведение фундаментальных исследований в области технических наук», проект: «Теоретические основы решения задач управления - идентификации - оценивания на основе объединенного принципа максимума».

Литература

1. Алешкин А.Н., Лабу тин С.А. Идентификация формы закона распределения случайных величин как задача приближения функций // Материалы заочных ВНТК "Современные проблемы математики и естествознания" и "Методы и средства измерений", 2002. - Н. Новгород: МВВО АТН РФ. - С. 6-9.

2. Безуглов Д.А. Кумулянтный метод оценки эффективности сегментированного зеркала адаптивной оптической системы // Оптика атмосферы и океана, 1996. №1. С.78-84.

3. Безуглов ДА. Поморцев П.М. Скляров A.B. Обработка результатов измерений на базе аппроксимации плотности распределения сглаживающими кубическими В-сплайнами // Измерительная техника, 2000, №9. -С.32-36.

4. Крамер. Г. Математические методы статистики. - М., 1948. - 648 с.

5. Малахов А.Н. Кумулянтный анализ случайных негауссовых процессов и их преобразований. - М.: «Сов. радио», 1978. -376 с.

югтранс

VII Международный транспортный форум

Форум «ЮгТранс» — это:

• традиционное открытие года

• 2 дня, 3 конференции, более 150 делегатов

• выступления экспертов в области транспорта

• обсуждение наиболее актуальных вопросов

• новые логистические решения

• транспортные проекты и международное сотрудничество

• внимание ведущих деловых и специализированных СМИ

Новороссийск

17-18 марта

2011

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Наукоёмкие технологии в космических исследованиях Земли № 1-2011

i Надоели баннеры? Вы всегда можете отключить рекламу.