УЧЕНЫЕ ЗАПИСКИ И А Г И Том XXI 1990
№ 2
УДК 533.6.071.08 : 532.57 : 621.375.8
ОЦЕНКА ПАРАМЕТРОВ НОРМАЛЬНОГО ЗАКОНА РАСПРЕДЕЛЕНИЯ ПО УСЕЧЕННОЙ ВЫБОРКЕ
Ю. А. Зленко, В. Г. Шумилкин
Рассматривается задача о нахождении оценок параметров нормального закона распределения по результатам наблюдения случайной величины в ограниченном диапазоне. Оценки параметров находятся из условия максимума функции правдоподобия. Погрешность оценок ММП получена методом статистического моделирования на ЭЦВМ. Проведено сравнение дисперсий оценок, полученных ММП и нижних границ дисперсий оценок параметров распределения (границ Рао-Крамера).
Цифровые методы обработки экспериментальной информации предполагают наличие _ряда измерений изучаемого параметра или представление исследуемого случайного процесса (СП) в виде последовательности дискретных отсчетов. Статистические свойства оценок (математического ожидания, дисперсии и т. д.), построенных на основе дискретного представления СП при условии независимости отсчетов и репрезентативности выборки достаточно хорошо изучены. Однако в измерительной практике встречаются случаи, когда выборка не отвечает требованиям репрезентативности. Алгоритмы обработки таких выборок практически отсутствуют. Причина, побуждающая рассматривать модель усеченной выборки, это непланируемая потеря информации о части возможных значений измеряемой случайной величины, обусловленная несовершенством метода измерений или измерительной системы (ИС). Потеря информации может быть, в частности, связана с тем, что диапазон измерения ИС меньше диапазона возможных значений СВ. Этот случай имеет место, например, при выполнении измерений скорости потока методом ЛДИС.
ЛДИС с дифференциальной оптической схемой и определением скорости по методу дискретного измерения доплеровской частоты измеряет мгновенную скорость VI газового потока в дискретные моменты времени. Для определения средней скорости V и степени турбулентности г=а/У (где а2 — дисперсия мгновенной скорости) необходимо выполнить ряд измерений мгновенной скорости К; и затем соответствующим образом обработать результаты измерений. Алгоритм обработки должен учитывать специфические особенности работы ЛДИС. В частности, ЛДИС рассматриваемой схемы фиксирует только те значения У,, величина которых заключена в некотором фиксированном интервале [Ун, Ув]. Границы интервала Ун, Ув определяются полосой пропускания фильтра на входе блока выделения доплеровской частоты. Наличие границ 1/„ и Ув может привести к тому, что функция распределения зафиксированных значений скорости V, будет существенно отличаться от функции распределения мгновенных скоростей потока. Оценки средней скорости и пульсаций потока соответственно как средней арифметической и выборочной дисперсии результатов измерения в этом случае будут иметь значительные ошибки. Алгоритм оценки V и е методом максимального правдоподобия с учетом конечности полосы измерения [Ун, Vв] рассматривался в работе [1]. Погрешность оценок ММП в [1] не анализировалась. В настоящей работе исследуются статистические свойства оценок параметров нормального закона распределения по выборке, формируемой из результатов измерения в ограниченном диапазоне.
1. Случайная величина (СВ)Х имеет одномерный нормальный закон распределе-ния с параметрами тх и о0. Имеется выборка объемом п (х±...........хп), из генеральной
совокупности N [тх, . Элементы выборки независимы и удовлетворяют условию ¿=1, 2.................., п (хн и хв—соответственно нижняя и верхняя граница вы-
о
борки). Требуется определить неизвестные параметры тх и о0 на основе (хи...,хп). л д.
Оценки параметров тх и а0 определим методом максимального правдоподобия.
С учетом независимости Xi функция правдоподобия может быть записана в виде
1>Х {мх> °о) = 1п Р (*i> ’ хп \ тх, 4) = 711п Р {*1 I тх> °о) > (!)
где р (jq.....х„ | тх, <Jq)— условная плотность появления данного ряда наблюдений
■(СВ)х (в диапазоне [хя, хв]), при условии, что математическое ожидание (СВ)* в генеральной СОВОКУПНОСТИ еСТЬ ГПХ И ДИСПерСИЯ .
Плотность распределения xt р(Хг\тх, Oq) определяется как
Р (*/1 тх, og) =
О
ехр
(•*«
г)2/^ао]
II
J ехр [— (х — mx)*l2<sl] dx
н О
(2)
Стандартная форма уравнений правдоподобия представляет собой необходимые условия экстремума функции правдоподобия (1) и с учетом (2) в данном случае может быть записана в виде
а п А / —2 /Л —2 ' \
2 _ 1 i Л 'i2 ао (— -хвЬ - -хЦг]
;о - — 2* W — тх ) +-J- UBe — лгн е *' > >
(3)
где
= j е dx ;
— , л \ ,Л - . л \ ; Л
■*„ = [хв — mx)la0; *н= (*„ — mx)i<j0;
( Л \1А {x — mx)ia 0.
л„
Оценки параметров тх и являются корнями системы уравнений (3),
Л А„
Исследование свойств оценок тх и ад, получаемых ММП, затрудняется тем, что решить систему (3) в аналитическом виде не представляется возможным. Это значи-
А Л,
тельно осложняет задачу анализа погрешностей оценок тх и о0. В связи с этим для исследования характеристик оценок ММП использован метод статистического моделирования на ЭЦВМ. Сущность метода сводится к следующему. Используя преобразование Н. В. Смирнова [2], вычисляются п значений (СВ)*, имеющих плотность распреде-А Л2
ления (2). Оценки тх и а0 находятся из решения системы уравнений (3) модифицированным методом Ньютона. Результаты расчетов, выполненных для различных значений параметров тх, <Sq , хн, хв, показали, что использование в качестве начального
приближения при решении (3) для тх средней арифметической и для »д — выборочной дисперсии обеспечивает хорошую сходимость и устойчивость итерационного процесса. В качестве математического ожидания и дисперсии оценок принимались выборочные средние и выборочные дисперсии:
Ц> = лг^т2^_(^'))2;
/=1
/=1
найденные в результате ^-кратного повторения описанной процедуры отыскания оценок.
Подробные параметрические расчеты были выполнены при следующих значениях
_ --- — Г, Ах Ах]
параметров: я=50-г-200; #=100; ао=5-т-40%; Д*=0,5-н2,0; тх = 11 ~ -тр , 1 + *<Н !
Ах =....—-в—, крайние величины интервала проанализированных значений тх
хв | ■ Хц
соответствуют варианту, когда границы интервала наблюдения (СВ)* совпадают с тх, т. е. наблюдается 50%-ное усеченное распределение. Результаты расчетов показали, что оценки ММП не имеют систематической ошибки.
Л Л,
2. Нижние границы дисперсий несмещенных оценок тх, а0 определяются из обобщенного неравенства Рао-Крамера [3] системой неравенств
а2 > у(/, о^),
(4>
где
уи. ])
— диагональные элементы матрицы /-*, обратной информационной матрице Фишера. Элементы матрицы Фишера определяются из соотношений:
7<\/
д 1п Ьх д \пЬх дг1 дГ]
д* 1п Ьх дг1 дГ]
ПХ> °о)
Для рассматриваемой системы оцениваемых параметров тх, о0 и функции Ьх, описываемой согласно (3), элементы информационной матрицы I определяются следующими выражениями:
1(тх, т
/(»о- ®о).
г)=-4- + »
- -3/2 - -хЦ
V Л —х„е 1
Л0 *-
^/2_7не-4/2_
-л
X \хве
/2_7„
• Х± 2
•У
1
А)
+ п
_ -хЦч -з -х\\ч _ -У-/2
хве 1 — х*е в1 — х„е 1 +
-о -Х~,1
+ х"е н'
1 » I п2 ■ ТЙ/ )
®о) = _2и_ (Г -в2/2 _ г ^/2 ) + ЙГ 1 (~Хв е
Уол V / У2 \
-г-.-*!1--,,.-*'!'
Л0
Х(*
X
х2'
72/
/2 — - *2/ —Х„е
(5>
Формулы (5) позволяют рассчитать диагональные элементы матрицы У^'^>
Л Л,
определяющие значения нижних границ дисперсий оценок т*, Од 120
у(?Of ®o) .
/(*0> 5о)
’ j{.mx* mx).j(°0. «„)_ (/(тж. 3°))2 ’
/(m.v. m*)
/(тж. -о) _ ( ,(тх, 3»))2 '
Для нижних границ среднеквадратичных погрешностей в определении тх и "о, отнесенных к Сто, из (6), с учетом (4) и (5), имеем:
1
m,ne«*= Yn\ I D
у(®0- »оЛ 1/2
1
/тх. тх)\112
(7)
где
/л V IDI
ji, I = Jo_ /г. / ; ^ у = Шдг> „2) ;
п к J
/, = /("*. **) (/"jr. ••))*.
Как следует из формул (7), относительная погрешность в определении тх и Оц
обратно пропорциональна объему измерений и стремится к нулю при п оо. Отметим,
что при положении границ интервала [хв, *в] достаточно «далеко» от центра распреде-
ления
\хв — тх\> За0; | х„ — тх \ >Зо0 и х„>тх>хн
зависимости (7) переходят в известные [3] зависимости погрешности среднего арифметического и погрешности эмпирического СКО
= о0
jVn ;
(8)
/\ /\л
Для оценок тх и из (3) в этом случае имеем
1 Л д2 1 Д( Л \2
= 1г2-Хг: •
г=1 /-1
На рис. 1 приведены результаты сравнения средних квадратичных отклонений (СКО) ат и оценок ММП (непрерывные кривые) и границ Рао-Крамера (пунк-
тирные кривые) в зависимости от положения тх относительно центра измерительного
Ах =1,0;п=100 ;М=100
Рис. 1
hx 4,0 ,N=300
—ммп
—границы Рай-Крамера
т. ¿*0,5] во=0,Ш
интервала тх — 2тх/(хв+хн). Негладкость зависимостей СКО оценок ММП объясняется конечностью числа выборок N, по которым вычислялись <зтх и <Jq как выборочные СКО.
Сравнение результатов параметрических расчетов границ Рао-Крамера по зависимостям (7) и дисперсий оценок ММП показало, что они практически совпадают при объеме выборки И>50-М00 (см. рис. 2).
Таким образом, при наличии нерепрезентативной выборки (СВ)* с распределением
N (тх, о2) оценки параметров тх и з2 можно оценивать по соотношениям (3), а их дисперсии согласно (7) (при объеме выборки л» 50).
ЛИТЕРАТУРА
1. Зленко Ю. А., Ш умилкин В. Г. Вопросы оптимальной обработки результатов измерений ЛДИС в турбулентных потоках. Сборник докладов. — II Всесоюзная конференция по методам аэрофизических исследований. СО АН СССР, ИТПМ, Новосибирск, 1979.
2. М а р т и н Ф. Моделирование на вычислительных машинах. — М.: Советское радио, 1972.
3. Левин Б. Р. Теоретические основы статистической радиотехники.— М.: Советское радио, 1975.
Рукопись поступила 9/Х 1981 г. Переработанный вариант поступил 25/VII 1989 г.