Научная статья на тему 'Оценка параметров нормального закона распределения по усеченной выборке'

Оценка параметров нормального закона распределения по усеченной выборке Текст научной статьи по специальности «Физика»

CC BY
778
43
i Надоели баннеры? Вы всегда можете отключить рекламу.
Журнал
Ученые записки ЦАГИ
ВАК
Область наук

Аннотация научной статьи по физике, автор научной работы — Зленко Ю. А., Шумилкин В. Г.

Рассматривается задача о нахождении оценок параметров нормального закона распределения по результатам наблюдения случайной величины в ограннченном диапазоне. Оценки параметров находятся из условия максимума функции правдоподобия. Погрешность оценок ММП получена методом статистического моделирования на ЭЦВМ. Проведено сравнение дисперсий оценок, полученных ММП и нижних границ дисперсий оценок параметров распределения (границ Рао-Крамера).

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Оценка параметров нормального закона распределения по усеченной выборке»

УЧЕНЫЕ ЗАПИСКИ И А Г И Том XXI 1990

№ 2

УДК 533.6.071.08 : 532.57 : 621.375.8

ОЦЕНКА ПАРАМЕТРОВ НОРМАЛЬНОГО ЗАКОНА РАСПРЕДЕЛЕНИЯ ПО УСЕЧЕННОЙ ВЫБОРКЕ

Ю. А. Зленко, В. Г. Шумилкин

Рассматривается задача о нахождении оценок параметров нормального закона распределения по результатам наблюдения случайной величины в ограниченном диапазоне. Оценки параметров находятся из условия максимума функции правдоподобия. Погрешность оценок ММП получена методом статистического моделирования на ЭЦВМ. Проведено сравнение дисперсий оценок, полученных ММП и нижних границ дисперсий оценок параметров распределения (границ Рао-Крамера).

Цифровые методы обработки экспериментальной информации предполагают наличие _ряда измерений изучаемого параметра или представление исследуемого случайного процесса (СП) в виде последовательности дискретных отсчетов. Статистические свойства оценок (математического ожидания, дисперсии и т. д.), построенных на основе дискретного представления СП при условии независимости отсчетов и репрезентативности выборки достаточно хорошо изучены. Однако в измерительной практике встречаются случаи, когда выборка не отвечает требованиям репрезентативности. Алгоритмы обработки таких выборок практически отсутствуют. Причина, побуждающая рассматривать модель усеченной выборки, это непланируемая потеря информации о части возможных значений измеряемой случайной величины, обусловленная несовершенством метода измерений или измерительной системы (ИС). Потеря информации может быть, в частности, связана с тем, что диапазон измерения ИС меньше диапазона возможных значений СВ. Этот случай имеет место, например, при выполнении измерений скорости потока методом ЛДИС.

ЛДИС с дифференциальной оптической схемой и определением скорости по методу дискретного измерения доплеровской частоты измеряет мгновенную скорость VI газового потока в дискретные моменты времени. Для определения средней скорости V и степени турбулентности г=а/У (где а2 — дисперсия мгновенной скорости) необходимо выполнить ряд измерений мгновенной скорости К; и затем соответствующим образом обработать результаты измерений. Алгоритм обработки должен учитывать специфические особенности работы ЛДИС. В частности, ЛДИС рассматриваемой схемы фиксирует только те значения У,, величина которых заключена в некотором фиксированном интервале [Ун, Ув]. Границы интервала Ун, Ув определяются полосой пропускания фильтра на входе блока выделения доплеровской частоты. Наличие границ 1/„ и Ув может привести к тому, что функция распределения зафиксированных значений скорости V, будет существенно отличаться от функции распределения мгновенных скоростей потока. Оценки средней скорости и пульсаций потока соответственно как средней арифметической и выборочной дисперсии результатов измерения в этом случае будут иметь значительные ошибки. Алгоритм оценки V и е методом максимального правдоподобия с учетом конечности полосы измерения [Ун, Vв] рассматривался в работе [1]. Погрешность оценок ММП в [1] не анализировалась. В настоящей работе исследуются статистические свойства оценок параметров нормального закона распределения по выборке, формируемой из результатов измерения в ограниченном диапазоне.

1. Случайная величина (СВ)Х имеет одномерный нормальный закон распределе-ния с параметрами тх и о0. Имеется выборка объемом п (х±...........хп), из генеральной

совокупности N [тх, . Элементы выборки независимы и удовлетворяют условию ¿=1, 2.................., п (хн и хв—соответственно нижняя и верхняя граница вы-

о

борки). Требуется определить неизвестные параметры тх и о0 на основе (хи...,хп). л д.

Оценки параметров тх и а0 определим методом максимального правдоподобия.

С учетом независимости Xi функция правдоподобия может быть записана в виде

1>Х {мх> °о) = 1п Р (*i> ’ хп \ тх, 4) = 711п Р {*1 I тх> °о) > (!)

где р (jq.....х„ | тх, <Jq)— условная плотность появления данного ряда наблюдений

■(СВ)х (в диапазоне [хя, хв]), при условии, что математическое ожидание (СВ)* в генеральной СОВОКУПНОСТИ еСТЬ ГПХ И ДИСПерСИЯ .

Плотность распределения xt р(Хг\тх, Oq) определяется как

Р (*/1 тх, og) =

О

ехр

(•*«

г)2/^ао]

II

J ехр [— (х — mx)*l2<sl] dx

н О

(2)

Стандартная форма уравнений правдоподобия представляет собой необходимые условия экстремума функции правдоподобия (1) и с учетом (2) в данном случае может быть записана в виде

а п А / —2 /Л —2 ' \

2 _ 1 i Л 'i2 ао (— -хвЬ - -хЦг]

;о - — 2* W — тх ) +-J- UBe — лгн е *' > >

(3)

где

= j е dx ;

— , л \ ,Л - . л \ ; Л

■*„ = [хв — mx)la0; *н= (*„ — mx)i<j0;

( Л \1А {x — mx)ia 0.

л„

Оценки параметров тх и являются корнями системы уравнений (3),

Л А„

Исследование свойств оценок тх и ад, получаемых ММП, затрудняется тем, что решить систему (3) в аналитическом виде не представляется возможным. Это значи-

А Л,

тельно осложняет задачу анализа погрешностей оценок тх и о0. В связи с этим для исследования характеристик оценок ММП использован метод статистического моделирования на ЭЦВМ. Сущность метода сводится к следующему. Используя преобразование Н. В. Смирнова [2], вычисляются п значений (СВ)*, имеющих плотность распреде-А Л2

ления (2). Оценки тх и а0 находятся из решения системы уравнений (3) модифицированным методом Ньютона. Результаты расчетов, выполненных для различных значений параметров тх, <Sq , хн, хв, показали, что использование в качестве начального

приближения при решении (3) для тх средней арифметической и для »д — выборочной дисперсии обеспечивает хорошую сходимость и устойчивость итерационного процесса. В качестве математического ожидания и дисперсии оценок принимались выборочные средние и выборочные дисперсии:

Ц> = лг^т2^_(^'))2;

/=1

/=1

найденные в результате ^-кратного повторения описанной процедуры отыскания оценок.

Подробные параметрические расчеты были выполнены при следующих значениях

_ --- — Г, Ах Ах]

параметров: я=50-г-200; #=100; ао=5-т-40%; Д*=0,5-н2,0; тх = 11 ~ -тр , 1 + *<Н !

Ах =....—-в—, крайние величины интервала проанализированных значений тх

хв | ■ Хц

соответствуют варианту, когда границы интервала наблюдения (СВ)* совпадают с тх, т. е. наблюдается 50%-ное усеченное распределение. Результаты расчетов показали, что оценки ММП не имеют систематической ошибки.

Л Л,

2. Нижние границы дисперсий несмещенных оценок тх, а0 определяются из обобщенного неравенства Рао-Крамера [3] системой неравенств

а2 > у(/, о^),

(4>

где

уи. ])

— диагональные элементы матрицы /-*, обратной информационной матрице Фишера. Элементы матрицы Фишера определяются из соотношений:

7<\/

д 1п Ьх д \пЬх дг1 дГ]

д* 1п Ьх дг1 дГ]

ПХ> °о)

Для рассматриваемой системы оцениваемых параметров тх, о0 и функции Ьх, описываемой согласно (3), элементы информационной матрицы I определяются следующими выражениями:

1(тх, т

/(»о- ®о).

г)=-4- + »

- -3/2 - -хЦ

V Л —х„е 1

Л0 *-

^/2_7не-4/2_

X \хве

/2_7„

• Х± 2

•У

1

А)

+ п

_ -хЦч -з -х\\ч _ -У-/2

хве 1 — х*е в1 — х„е 1 +

-о -Х~,1

+ х"е н'

1 » I п2 ■ ТЙ/ )

®о) = _2и_ (Г -в2/2 _ г ^/2 ) + ЙГ 1 (~Хв е

Уол V / У2 \

-г-.-*!1--,,.-*'!'

Л0

Х(*

X

х2'

72/

/2 — - *2/ —Х„е

(5>

Формулы (5) позволяют рассчитать диагональные элементы матрицы У^'^>

Л Л,

определяющие значения нижних границ дисперсий оценок т*, Од 120

у(?Of ®o) .

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

/(*0> 5о)

’ j{.mx* mx).j(°0. «„)_ (/(тж. 3°))2 ’

/(m.v. m*)

/(тж. -о) _ ( ,(тх, 3»))2 '

Для нижних границ среднеквадратичных погрешностей в определении тх и "о, отнесенных к Сто, из (6), с учетом (4) и (5), имеем:

1

m,ne«*= Yn\ I D

у(®0- »оЛ 1/2

1

/тх. тх)\112

(7)

где

/л V IDI

ji, I = Jo_ /г. / ; ^ у = Шдг> „2) ;

п к J

/, = /("*. **) (/"jr. ••))*.

Как следует из формул (7), относительная погрешность в определении тх и Оц

обратно пропорциональна объему измерений и стремится к нулю при п оо. Отметим,

что при положении границ интервала [хв, *в] достаточно «далеко» от центра распреде-

ления

\хв — тх\> За0; | х„ — тх \ >Зо0 и х„>тх>хн

зависимости (7) переходят в известные [3] зависимости погрешности среднего арифметического и погрешности эмпирического СКО

= о0

jVn ;

(8)

/\ /\л

Для оценок тх и из (3) в этом случае имеем

1 Л д2 1 Д( Л \2

= 1г2-Хг: •

г=1 /-1

На рис. 1 приведены результаты сравнения средних квадратичных отклонений (СКО) ат и оценок ММП (непрерывные кривые) и границ Рао-Крамера (пунк-

тирные кривые) в зависимости от положения тх относительно центра измерительного

Ах =1,0;п=100 ;М=100

Рис. 1

hx 4,0 ,N=300

—ммп

—границы Рай-Крамера

т. ¿*0,5] во=0,Ш

интервала тх — 2тх/(хв+хн). Негладкость зависимостей СКО оценок ММП объясняется конечностью числа выборок N, по которым вычислялись <зтх и <Jq как выборочные СКО.

Сравнение результатов параметрических расчетов границ Рао-Крамера по зависимостям (7) и дисперсий оценок ММП показало, что они практически совпадают при объеме выборки И>50-М00 (см. рис. 2).

Таким образом, при наличии нерепрезентативной выборки (СВ)* с распределением

N (тх, о2) оценки параметров тх и з2 можно оценивать по соотношениям (3), а их дисперсии согласно (7) (при объеме выборки л» 50).

ЛИТЕРАТУРА

1. Зленко Ю. А., Ш умилкин В. Г. Вопросы оптимальной обработки результатов измерений ЛДИС в турбулентных потоках. Сборник докладов. — II Всесоюзная конференция по методам аэрофизических исследований. СО АН СССР, ИТПМ, Новосибирск, 1979.

2. М а р т и н Ф. Моделирование на вычислительных машинах. — М.: Советское радио, 1972.

3. Левин Б. Р. Теоретические основы статистической радиотехники.— М.: Советское радио, 1975.

Рукопись поступила 9/Х 1981 г. Переработанный вариант поступил 25/VII 1989 г.

i Надоели баннеры? Вы всегда можете отключить рекламу.