Научная статья на тему 'Исследование оценок параметра масштаба взвешенного метода максимального правдоподобия'

Исследование оценок параметра масштаба взвешенного метода максимального правдоподобия Текст научной статьи по специальности «Науки о Земле и смежные экологические науки»

CC BY
502
57
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ПАРАМЕТР МАСШТАБА / РОБАСТНЫЕ ОЦЕНКИ / ВЗВЕШЕННЫЙ МЕТОД МАКСИМАЛЬНОГО ПРАВДОПОДОБИЯ / SCALE PARAMETER / ROBUST ESTIMATES / WEIGHED MAXIMUM LIKELIHOOD METHOD

Аннотация научной статьи по наукам о Земле и смежным экологическим наукам, автор научной работы — Батраков Петр Андреевич, Черепанов Олег Сергеевич

В статье рассматриваются оценки параметра масштаба взвешенного метода максимального правдоподобия. Проводится исследование эффективности полученных оценок и их сравнение с классическими оценками для ряда типовых распределений в условиях модели Тьюки с симметричными и асимметричными выбросами. Результаты исследования показывают высокую эффективность предложенных оценок по сравнению с классическими робастными оценками.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Investigation of estimates of scale parameter of weighed maximum likelihood method

In the paper estimations of scale parameter are considered. The efficiency of estimates and comparison with classical estimations is conducted for number of typical distributions under Tukey model with symmetrical and asymmetrical outliers. The results of investigations demonstrate higher efficiency than the classical robust estimates.

Текст научной работы на тему «Исследование оценок параметра масштаба взвешенного метода максимального правдоподобия»

ФИЗИКО-МАТЕМАТИЧЕСКИЕ НАУКИ ОМСКИЙ НАУЧНЫЙ ВЕСТНИК №2 (130) 2014

18

УДК 519.233.22 п. А. БАТРАКОВ

О. С. ЧЕРЕПАНОВ

Омский государственный технический университет

Курганский государственный университет

ИССЛЕДОВАНИЕ ОЦЕНОК ПАРАМЕТРА МАСШТАБА ВЗВЕШЕННОГО МЕТОДА МАКСИМАЛЬНОГО ПРАВДОПОДОБИЯ

В статье рассматриваются оценки параметра масштаба взвешенного метода максимального правдоподобия. Проводится исследование эффективности полученных оценок и их сравнение с классическими оценками для ряда типовых распределений в условиях модели Тьюки с симметричными и асимметричными выбросами. Результаты исследования показывают высокую эффективность предложенных оценок по сравнению с классическими робастными оценками.

Ключевые слова: параметр масштаба, робастные оценки, взвешенный метод максимального правдоподобия.

Введение. Математическая статистика предлагает большой арсенал методов оценивания параметра масштаба [1—4]. Хорошо известное среднеквадратическое отклонение является оптимальным для нормального распределения, но быстро теряет свою эффективность при наличии выбросов. Оценка абсолютного отклонения от медианы обладает робастными свойствами и эффективна для распределения Коши, но крайне не эффективная для распределений с более легкими хвостами. Взвешенный метод максимального правдоподобия (ВММП) [5] предлагает способ получения эффективных оценок, устойчивых к наличию выбросов. В данной работе предлагаются оценки параметра масштаба ВММП и проводятся исследование их эффективности для ряда типовых распределений при наличии выбросов. Полученные оценки включают в себя оценки максимального правдоподобия, радикальные оценки и оценки максимальной устойчивости [3] как частные случаи. Синтезированные оценки были использованы в задачах точечного оценивания параметра сдвига [6], задаче регрессии [7] и прогноза, где параметр масштаба выступает в роли мешающего параметра.

1. Взвешенный метод максимального правдоподобия. Оценки взвешенного метода максимального правдоподобия относятся к классу М-оценок, определяемых уравнением вида:

£ф(х, ■ 6«) = 0, (1)

ф(х,0) = I — 1од^(x,0) + р8 ]/'(х,0). (2)

где ф(х,0) — оценочная функция, Дх) — плотность распределения, 5 — параметр масштаба, 1 — параметр радикальности, определяющий робастность оценки, Рв — параметр, рассчитываемый из условия несмещенности оценки:

£ф(х, 0) = 0 .

При 1=0 и Рв =0 получаем оценки максимального правдоподобия, при 1=0,5 и 1= 1— радикальные оценки и оценки максимальной устойчивости соответственно.

В [5] показано, что ^/2(0М—Е0) имеет асимптотическое нормальное распределение с дисперсий

|ф2(х, 0)^(х) ||0ф(х, 0^(х)

V

2. Оценки параметра масштаба для типовых распределений. Выпишем оценки параметра масштаба и их дисперсии для класса типовых симметричных распределений с разной степенью затянутости хвостов. Будем рассматривать следующий класс распределений:

— обобщенно-нормальное распределений 4-й степени (ОНР4);

— нормальное распределение (НР);

— распределение Лапласа (РЛ);

— распределение Коши (РК).

Без потери общности положим, что параметр сдвига для рассматриваемого класса распределений равен 0.

2.1. Обобщенно-нормальное распределение 4-й степени. Плотность ОНР4 имеет вид:

9і(х) '■

2

^Г(0,25)

Оценка параметра 5, согласно (1) и (2), примет вид:

X

&1(х, ) = °.

(3)

2

4

Масштабный коэффициент Р1 для распределения F(x,5) будет рассчитываться из условия несмещенности оценки

А =

| х4д1(х, Б^р(х, 8)

19І(х, s)dF(x, в)

Рз —

1 | |х|?3 (х, s)dF(x.s) I д'з (Х8^р(х.8)

Дисперсия оценки параметра масштаба определяется следующим выражением:

Дисперсия оценки параметра масштаба будет определяться следующим образом:

4|^ I - А I д!‘(х^г(х)

' I 4 1 Т] _ Аі ]| 4І^ - 1]- 161 х

-рз) 9з2'(х)^(х)

93(х)^(х)

2.4. Распределение Коши. Плотность РК имеет вид:

9І(х^В(х)

2.2. Нормальное распределение. Плотность НР имеет вид:

1

_11 х_ЕЛ

92(х) = —^ге 21 5 ^ .

5л/ 2ж

Оценка параметра 5, согласно (1) и (2), примет вид:

9з(х) = ■

1 +

Оценка параметра 5, согласно (1) и (2), примет вид:

2™м| — 1 94(х,, ^ ) -р4

,

94(х,, ) = 0. (6)

Масштабный коэффициент Р4 для распределения F(x,5) будет иметь следующий вид:

X

ї I- А2

9 2(х,, ^) = 0.

(4)

Масштабный коэффициент Р2 для распределения F(x,5) будет рассчитываться следующим образом:

А =

Г х 292(х, s)dF(x, в)

1 -со

82 ""I .

Г 9 2(х, s)dF(x, в)

Дисперсия оценки параметра масштаба определяется следующим выражением:

Р 4 =

Г х 294+1(х, s)dF(x.s)

Г 94 (х, Б^Р(х.з)

Дисперсия оценки параметра масштаба определяется следующим выражением:

П 2Ц ] 94(х) -р4

2%б\ х] 94(х)| 2Я/хI 94(х) - 2 | +

'I Ч]■ - А.)((8Т -1)-<7 ’

д2(х)<ІР(х)

9?(х^(х)

+ '( 2жв(х) 94 (х) - А4 )(2я5(х) 94(х) - 1)

94(х^(х)

2.3. Распределение Лапласа. Плотность РЛ имеет вид:

1 Iх-А

9з(х) = —е 5 .

25

Оценка параметра 5, согласно (1) и (2), примет вид:

X

9з(хі, ) = 0.

(5)

Масштабный коэффициент Р3 для распределения F(x,5) будет иметь следующий вид:

3. Исследование эффективности оценок параметра масштаба. Проводилось исследование эффективности оценок параметра масштаба (3) — (6) на обобщенно-нормальном распределении 4-й степени, нормальном распределении, распределении Лапласа и распределении Коши в условиях модели выбросов Тьюки:

— симметричные выбросы (СВ):

Г(х) = (1 - е)9(х) + ед(х - а);

— асимметричные выбросы (АВ):

4

2

Уз = 5

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

2

2

4

1

2

2

2

2

2

2

У4 = в

2

2

2

ОМСКИЙ НАУЧНЫЙ ВЕСТНИК №2 (130) 2014 ФИЗИКО-МАТЕМАТИЧЕСКИЕ НАУКИ

ФИЗИКО-МАТЕМАТИЧЕСКИЕ НАУКИ ОМСКИЙ НАУЧНЫЙ ВЕСТНИК №2 (130) 2014

Таблица 1

Значения параметров масштаба для типовых распределений

Распределение ОНР4 НР РЛ РК

Значение параметра масштаба 1,767 0,7144 0,2605

Таблица 2

Эффективность оценок параметра масштаба на распределениях (7)— (10)

Оценка ОМП РО ОМУ СКО АО САО ОВСКО ОВАО ООНР4 ООК

Распределение (7)

V 0,781 1,046 1,584 0,928 3,335 1,291 0,928 1,291 0,781 1,282

є 1,000 0,747 0,493 0,841 0,234 0,605 0,842 0,605 1,000 0,609

Распределение (8)

V 9,546 1,397 1,903 4,483 3,851 2,603 1,635 2,097 1,367 1,925

є 0,143 0,979 0,718 0,049 0,355 0,525 0,836 0,652 1,000 0,710

Распределение (9)

V 25,020 1,162 1,760 14,733 4,178 8,992 1,393 2,866 0,881 2,171

є 0,035 0,758 0,501 0,060 0,211 0,098 0,632 0,307 1,000 0,406

Распределение (10)

V 3,642 1,578 1,998 2,389 3,969 2,033 1,639 1,952 1,576 1,900

є 0,433 0,999 0,789 0,660 0,397 0,775 0,962 0,807 1,000 0,829

Таблица 3

Эффективность оценок параметра масштаба на распределениях (11)—(14)

Оценка ОМП РО ОМУ СКО АО САО ОВСКО ОВАО ООНР4 ООК

Распределение (11)

V 0,500 0,708 1,154 0,500 1,361 0,571 0,500 0,570 0,545 0,723

є 1,000 0,706 0,433 1,000 0,367 0,876 1,000 0,877 0,917 0,691

Распределение (12)

V 1,999 0,883 1,328 1,999 1,544 1,031 0,807 0,857 0,900 0,907

є 0,404 0,914 0,608 0,404 0,523 0,783 1,000 0,942 0,897 0,890

Распределение (13)

V 4,955 0,789 1,283 4,955 1,700 3,250 0,685 1,239 0,608 1,153

є 0,123 0,771 0,474 0,123 0,358 0,187 0,888 0,491 1,000 0,527

Распределение (14)

V 0,871 1.060 1,554 0,871 1,650 0,809 0,841 0,807 1,222 0,958

є 0,927 0,761 0,519 0,927 0,489 0,998 0,960 1,000 0,660 0,842

Таблица 4

Эффективность оценок параметра масштаба на распределениях (15)—(18)

Оценка ОМП РО ОМУ СКО АО САО ОВСКО ОВАО ООНР4 ООК

Распределение (15)

V 0,510 0,807 1,512 0,637 1,055 0,510 0,543 0,510 0,635 0,635

є 1,000 0,632 0,337 0,801 0,483 1,000 0,939 1,000 0,803 0,803

Распределение (16)

V 0,797 0,884 1,601 2,007 1,160 0,800 0,729 0,648 0,943 0,731

є 0,813 0,733 0,405 0,323 0,559 0,810 0,889 1,000 0,687 0,886

Распределение (17)

V 1,970 1,018 1,681 2,490 1.322 1,970 0,702 1,003 0,820 0,965

є 0,356 0,690 0,418 0,282 0,531 0,356 1,000 0,700 0,856 0,727

Распределение (18)

V 0,592 1,103 1,933 0,586 1,298 0,592 0,578 0,591 1,113 0,840

є 0,976 0,524 0,299 0,986 0,445 0,976 1,00 0,978 0,519 0,688

Таблица 5

Эффективность оценок параметра масштаба на распределениях (19)-(22)

Оценка ОМП РО ОМУ АО ОВСКО ОВАО ООНР4 ООК

Распределение (19)

V 0,136 0,184 0,271 0,168 0,193 0,148 0,312 0,136

є 1,000 0,739 0,502 0,810 0,704 0,919 0,435 1,000

Распределение (20)

V 0,146 0,196 0,287 0,183 0,220 0,161 0,255 0,146

є 1,000 0,745 0,509 0,780 0,664 0,907 0,573 1,000

Распределение (21)

V 0,191 0,208 0,302 0,209 0,216 0,174 0,348 0,174

є 0,91 0,84 0,58 0,833 0,81 0,5 1

Распределение (22)

V 0,185 0,218 0,309 0,208 0,231 0,242 0,357 0,182

є 0,984 0,835 0,589 0,875 0,788 0,752 0,510 1,000

і(х) = (1 - е)д(х) + ед\ -

і(х) =

1.8

0.2

( х-2.5 V \ 1.767 )

1.767Г(0.25)

1.767Г(0.25)

. (10)

Параметр масштаба для основного распределения подбрился таким образом, чтобы квантиль уровня 0,95 совпадал с квантилем уровня 0,95 стандартного нормального распределения (табл. 1).

Относительная эффективность оценки определяется как

_ V V ,

3.2. Оценивание параметра масштаба нормального распределения. Проводилось сравнение оценок параметра масштаба нормального распределения на следующих распределениях (табл. 3):

І (х)

1

(11)

где V — вариация оценки, Уор1 — вариация оценки, имеющей минимальную вариацию среди рассматриваемых оценок.

Эффективность полученных оценок сравнивались с оценками максимального правдоподобия (ОМП), радикальными оценками (РО), оценками максимальной устойчивости (ОМУ), средним квадратичным отклонением (СКО), абсолютным отклонением (АО) и средним абсолютным отклонением (САО).

Оценки (3) — (6) с оптимальными значениями параметра радикальности будем называть оптимальной оценкой обощенно-нормального распределения 4-й степени (ООНР4), оптимальным взвешенным среднем квадратичным отклонением (ОВСКО), оптимальным взвешенным абсолютным отклонением (ОВАО), оптимальным оценкой Коши (ООК) соответственно.

3.1. Оценивание параметра масштаба обобщеннонормального распределения 4-й степени. Проводилось сравнение оценок параметра масштаба обобще-но-нормального распределения 4-й степени на следующих распределениях (табл. 2):

і (х) =

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

2

І — I

1 1.767 )

1.767Г(0.25)

і (х) =

і (х) =

1.8

1.767Г(0.25)

1.8

---------------(

1.767Г(0.25)

0.2

5.301Г(0.25)

0.2

----------------(

1.767Г(0.25)

I

I. 1.767 )

(7)

(8)

(9)

а , 0.9

і (х) = ^= е

0.1 --

3^І2ж

0.1

+ ^= е

■\}2ж

(х-8)2 2

і (х) =

0.9

е 2 +

0.1

-.рік

(12)

(13)

(14)

3.3. Оценивание параметра масштаба распределения Лапласа. Проводилось сравнение оценок параметра масштаба распределения Лапласа на следующих распределениях (табл. 4):

і (х) =

1

|х|

0,7144

1.1488

0.9

і (х) = ----------е

1.1488

|х|

0,7144

0.1

+----------е

4.2864

|х|

2,1432

0.9

і (х) = ----------е

1.1488

|х|

0,7144

0.1

+----------е

1.1488

|х-8 0,7144

(15)

(16)

(17)

0.9

і (х) = ----------е

1.1488

|х|

0,7144

0.1

+---------е

1.1488

| х-2.5|

отШ (18)

3.4. Оценивание параметра масштаба распределения Коши. Проводилось сравнение оценок пара-

(х- 2.5)

х

2

ОМСКИЙ НАУЧНЫЙ ВЕСТНИК №2 (130) 2014 ФИЗИКО-МАТЕМАТИЧЕСКИЕ НАУКИ

ФИЗИКО-МАТЕМАТИЧЕСКИЕ НАУКИ ОМСКИЙ НАУЧНЫЙ ВЕСТНИК №2 (130) 2014

метра масштаба распределения Коши на следующих распределениях (табл. 5):

1

f (X) = -

f (X)

) 0.2605/ Г1 + f X У0.2605 0.9

0.2605/ r1+f X т У 0.2605 ) 0.1

0.7815/ 1+f X Т ' У 0.7815 ) 0.9

0.2605/ 1 + f X ] у 0.2605 ) 0.1

0.2605/ 1+fX-8T у0.2605 ) 0.9

)= ) 0.2605/ 1 + f X ] у0.2605 ) 0.1

0.2605/ 14X - “ Y У 0.2605 )

(19)

(20)

(21)

(22)

Заключение. В работе были предложены оценки параметров масштаба на основе взвешенного метода максимального правдоподобия. Было проведено сравнение эффективности полученных оценок с наиболее известными оценками параметра масштаба. По результатам исследования можно сделать следующие выводы:

1. Оценки взвешенного метода максимального правдоподобия при условии совпадения априорного и исходного распределения при наличии симметричных выбросов являются наиболее эффективными в рамках рассматриваемых оценок.

2. При наличии асимметричных выбросов эффективность оценки взвешенного метода максимального правдоподобия может зависеть от параметра сдвига

засоряющего распределения. В случае, когда выбросы находятся достаточно близко к основному распределению или внутри него, оценки с более мягким усечением (весовые функции g *(х) с более затянутыми хвостами) начинают проигрывать оценкам с более жестким усечением.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

3. При удалении выбросов от основного распределения эффективность оценок при условии совпадения априорного и исходного распределения начинает возрастать.

4. Оценки максимальной устойчивость проигрывают оценкам с оптимальным значением параметра радикальности, что говорит о слишком сильном усечении ОМУ.

5. Ввиду сложного выбора наиболее эффективных оценок параметра масштаба требуется синтез алгоритмов адаптивных как к наличию и степени выбросов, так и по виду исходного распределения.

Библиографический список

1. Робастность в статистике / Ф. Хампель [и др]. — М. : Мир, 1989 — 512с.

2. Хьюбер, П. Робастность в статистике / П. Хьюбер. — М. : Мир, 1984 - 303 с.

3. Шурыгин, А. М. Прикладная статистика. Робастность. Оценивание. Прогноз / А. М. Шурыгин. — М. : Финансы и статистика, 2000 — 223 с.

4. Шуленин, В. П. Математическая статистика. Ч. 3. Робастная статистика / В. П. Шуленин — Томск : Изд-во НТЛ, 2012. — 518 с.

5. Симахин, В. А. Непараметрическая статистика. Ч. II. Теория оценок / В. А. Симахин. — Курган : Изд-во КГУ, 2004 — 163 с.

6. Симахин, В. А. Робастные непараметрические оценки / В. А. Симахин. — Saarbrucken : LAMBERT Academic Publishing, 2011. — 292 с.

7. Симахин, В. А. Адаптивные оценки параметра сдвига /

B. А. Симахин, О. С. Черепанов // Вестник ТГУ. Управление, вычислительная техника и информатика. — 2013. — № 1. —

C. 131-137.

БАТРАКОВ Петр Андреевич, ассистент кафедры теплоэнергетики Омского государственного технического университета.

ЧЕРЕПАНОВ Олег Сергеевич, аспирант, ассистент кафедры программного обеспечения автоматизированных систем Курганского государственного университета.

Адрес для переписки: [email protected]

Статья поступила в редакцию 04.03.2014 г.

© П. А. Батраков, О. С. Черепанов

2

+

+

+

+

+

Книжная полка

537/К17

Калистратова, Л. Ф. Основы колебательного и волнового движений : учеб. электрон. изд. локального распространения : учеб. пособие для студентов по направлению 5511 и специальности 2008 и 2205 / Л. Ф. Калистратова, А. А. Гладенко, Э. М. Ярош ; ОмГТУ. — Омск: Изд-во ОмГТУ, 2013. — 1 о=эл. опт. диск (CD-ROM).

В учебном электронном издании представлено описание физических основ гармонических механических и электромагнитных колебаний. Приводятся примеры решения задач, сводки формул. Предложены вопросы и задачи для проведения коллоквиума или экзамена. Предназначено для студентов радиотехнического факультета, обучающихся по специальностям 2008.00 «Проектирование и технология электронных средств», 2007.00 «Радиотехника», 2205.00 «Конструирование и технология ЭВС» и другим родственным специальностям.

i Надоели баннеры? Вы всегда можете отключить рекламу.