Научная статья на тему 'Анализ эффективности процедур устойчивого нелинейного оценивания при обработке данных'

Анализ эффективности процедур устойчивого нелинейного оценивания при обработке данных Текст научной статьи по специальности «Математика»

CC BY
302
32
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по математике, автор научной работы — Авраменко Валерий Павлович, Халявин Владимир Александрович

Исследуются основные алгоритмы робастных оценок. Выполняется сравнительный анализ робастных методов оценивания зашумленных выборок результатов наблюдений. Показывается, что за устойчивость оценок приходится расплачиваться пятипроцентной точностью; оценивание параметров в автоматизированных системах целесообразно производить совокупностью алгоритмов.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Авраменко Валерий Павлович, Халявин Владимир Александрович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

The analysis of efficiency procedures of robust nonlinear estimations at data processing

The basic algorithms of robust estimations are examined. The comparative analysis of the robust methods was accomplished. Is shown, that for stability of estimations it is necessary to pay by five-percentage accuracy; the estimations of parameters in the automated systems it is expedient to make by set of algorithms.

Текст научной работы на тему «Анализ эффективности процедур устойчивого нелинейного оценивания при обработке данных»

УДК 681.518.54

АНАЛИЗ ЭФФЕКТИВНОСТИ ПРОЦЕДУР УСТОЙЧИВОГО НЕЛИНЕЙНОГО ОЦЕНИВАНИЯ ПРИ ОБРАБОТКЕ ДАННЫХ

АВРАМЕНКО В.П., ХАЛЯВИНВ.А.

Исследуются основные алгоритмы робастных оценок. Выполняется сравнительный анализ робастных методов оценивания зашумленных выборок результатов наблюдений. Показывается, что за устойчивость оценок приходится расплачиваться пятипроцентной точностью; оценивание параметров в автоматизированных системах целесообразно производить совокупностью алгоритмов.

Постановка задачи исследования

Практика обработки данных в различных отраслях науки и техники показала, что снятие результатов наблюдений часто производится при значительных нарушениях исходных предпосылок научного эксперимента (нормальность, независимость, однородность), которые кладутся в основу методов математической статистики. Все это выдвигает проблему разработки методов, процедур и алгоритмов получения более загрубленных оценок параметров модели, менее чувствительных к отклонению исходных предпосылок. Такие методы оценивания параметров, нечувствительные или слабочувствительные к структуре данных, принято называть устойчивыми или робастными [1, с. 132137; 2, вып. 1, с. 204-217, вып. 2, с. 135-144].

Медианные оценки

Большинство устойчивых алгоритмов определения контрольного итога базируется на использовании порядковых статистик и построении взвешенных оценок. Порядковая статистика имеет место в том случае, если элементы исходного ряда наблюдений xb x2,...,xn объема n расположены в порядке строгого возрастания yj < y2 < ... < yn . Классической оценкой центра распределения, основанной на порядковых статистиках, является выборочная

медиана у, которая вычисляется по формуле

Г yk+1 при n = 2k +1,

у = і і

|-(Ук + Ук+і) при n = 2k.

Медианные оценки являются слабочувствительными к действию импульсных помех. Этот факт можно подтвердить следующим примером. Определим контрольный итог центра распределения и рассеивания ряда наблюдений 1, 2, 3, 4, 5, 6, 7, 8, 8, 10, 10 при одном “аномальном” измерении 10—>53 (когда вместо последнего значения ряда 10 измерено 53). Для исходного ряда среднее арифметическое у1 = 5,82 , среднеквадратическое отклонение оу1 = 0,97, медиана у 1 = 6,0, медиана абсолютных отклонений МАО(у 1) = 2,0. Для измененного

ряда 1, 2, 3, 4, 5, 6, 7, 8, 8, 10, 53 имеем у2 = 8,82, ау2 = 4,6, у2 = 6,0 , MAO(y 2) = 2,0. Дисперсия среднего катастрофически (в 24 раза) возросла при наличии импульсной помехи.

Слабую чувствительность медианы к “хвостам” распределений по сравнению со средним можно продемонстрировать, воспользовавшись моделью суммарной ошибки, для которой плотность распределения имеет вид [2, вып. 2, с. 137]

Ну) = — 9(Z) + -%(Z),

а а х х

(1)

причем т > ст, 0 < p <

Плотность распределения (1) при большой вероятности (1 - p) > — определяется первым слагаемым -нормальной ошибкой N(0, ст 2) с нулевым средним и дисперсией ст 2 , а при малой вероятности (1 - p) < — — нормальной ошибкой N(0, т 2) с большей дисперсией т2. Задавшись численными значениями а = 1, т = 3 , определим дисперсии среднего и выборочной медианы у по формулам [2, вып. 2, с .137]:

nvar(y) = (1 - p)ct 2 + px2 = 1 + CTp, (2)

•П 3 _2

nvar(y) = -(1 --p) 2. (3)

Задавшись различными значениями вероятности p, вычислим по формулам (2) и (3) дисперсии среднего и медианы и занесем их в табл. 1.

Таблица 1

p 0 0,05 0,10 0,20 0,25 0,30

Nvarx 1,00 1,40 1,80 2,60 3,00 3,40

Nvarx 1,57 1,69 1,83 2,14 2,36 2,60

Полученные результаты свидетельствуют о быстром ухудшении среднего и относительной устойчивости медианы. Объясняется это тем, что на значения средних в отличие от значений медианы оказывает сильное влияние даже небольшое количество “аномальных” измерений.

Винзоризованные оценки

Более устойчивыми по сравнению с медианными являются винзоризованные оценки, которые оказываются более эффективными в условиях действия импульсных помех (выбросов). Процедура оценивания включает в себя следующие шаги:

1) построение порядковой статистики у1 <... < yn ;

2) формирование q -винзоризованной статистики путем замены первых q наблюдений на yq+1, а

последних q на yn-q при 0 < q <—n ;

3) нахождение среднего, дисперсии и доверительного интервала для среднего q -винзоризованной статистики:

РИ, 2000, № 3

61

z1 - z2 - ••• - zq - y q+1 ,

Zq+i = yq+i,2 < І < П - 2q - >

zn _ zn-1 _ zn-q-1 _ y n-q

по следующим формулам [1, c.133]:

Для рассмотренного ранее ряда 1, 2, 3, 4, 5, 6, 7, 8, 8, 10, 53 по формулам (4)-(6) вычислим p -усеченные оценки при p = 1,2,3 и определим оценку среднего с минимальным доверительным интервалом. При p = 1 имеем:

1 n 2 1 n 2 z = - zzi, S2 =-----£(zi -z)2,

ni=1

z +1

n -1

І = 1

(n-1) Sz (1-|),(h-1)(h -

где h = n -1.

Для рассмотренного ранее ряда наблюдений 1, 2, 3, 4, 5, 6, 7, 8, 8, 10, 53 обычные оценки среднего, стандартного отклонения и 95%-ного доверительного интервала для среднего соответственно равны:

: = 8,82 ; sy = 4,6 ,8,82 +10,975.9101*4= = (5,62;12,02).

9 Vi!

Если q = 1, то один-винзоризованный ряд имеет

10 0,92

У1 = 5,88, Sy = 0,92, 5,88 + 1о,975;8 (-j^ =

Результаты вычислений занесены в табл. 3, из которой следует, что минимальным доверительным интервалом обладает одноусеченная оценка, она определяет контрольный итог с максимальной точностью. При выборе доли урезания обычно исходят из обеспечения надлежащей защиты от выбросов при сохранении достаточно высокой точности на выборках из нормального распределения. Практика применения урезанных оценок показала, что вполне приемлемые результаты оценивания получаются, если доля урезания выбирается из соотношения q и (0,1 + 0,2)n.

вид 2, 2, 3, 4, 5, 6, 7, 8, 8, 10, 10, а h = n -2q = 9. Соответствующие один-винзоризованные оценки среднего, стандартного отклонения и доверительного интервала равны:

У1 = 5,64 , Sy = 0,9 ,

5,64 + І0,975;8у;0= = (4,77.6,51).

Таблица 3

p z а- z _ n _ 1 а- z ± 1 а ( )~i=, (1 2"),(h-1) h -1 Vn Интервал

0 8,82 4,60 (5,62; 12,02) 6,40

1 5,88 0,92 (5,08; 6,68) 1,60

2 5,86 0,80 (4,88; 6,84) 1,96

Результаты аналогичных вычислений при q = 2, 3 занесены в табл.2, из которой следует, что минимальная длина доверительного интервала имеет место для два-винзоризованной оценки, являющейся наиболее точной.

Устойчивые оценки

Идея метода исходит из предположения, что задана последовательность независимых, одинаково распределенных случайных величин xb...,xn с известной априори непрерывной плотностью распределения f(x - a), где a — параметр сдвига. Согласно методу максимального правдоподобия составляется мультипликативная функция правдоподобия, которая после логарифмирования записывается в виде [3, с. 12]:

n n

Ln (a) = ^ ln f(xi - a) = -£ р(х* - a),

i=1 i=1

а затем отыскивается ее максимальное значение по параметру a или минимальное значение выра-

Таблица 2

q У o- У У ± 1 a (— )І, y (1--|),(h-1) h - rVn Интервал

0 8,82 4,60 (5,62; 12,02) 6,4

1 5,64 0,90 (4,77; 6,51) 1,74

2 5,73 0,69 (4,88; 6,58) 1,70

3 6,00 0,58 (4,86; 7,14) 2,28

Усеченные оценки

Усеченные оценки среднего, стандартного отклонения и доверительного интервала для среднего строятся после отбрасывания p крайних наблюдений порядковой статистики исходного ряда. Для нахождения p -усеченной оценки среднего и дисперсии воспользуемся приближенными формулами [1, с. 135]:

1 h-p

z = - Zzi,

h i=p+1

2 1 h-p 2

s2 = —г E (zi -z)2

z h -1 i=p+1

(4)

(5)

- n -1 Sz

z * 11 1 (T—7)~г,

1—2;h _1 h -1 Vn

(6)

жения K(a) _^P(xi a), где p(y) = -lnf(x).

i=1

Поиск экстремума в предположении гладкости функции K(a) находится путем дифференцирования по параметру и приравнивания полученного выражения нулю. В результате получается уравне-

ние вида ZT(xi a) - 0 или в инвариантной фор-i=1

.n (xi - a4 _ 0

ме ^Т( ) - 0, из которого определяется иско-

i=1 s

мый параметр a . Основной трудностью в получении М-оценок является выбор надлежащей функ-

где h = n - 2p . 62

РИ, 2000, № 3

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

ции у(-), которая обеспечивает требуемую помехозащищенность и эффективность оценок.

Функция у(-) связана с определенным законом распределения результатов наблюдений и для некоторых из них имеет вид:

1) для нормального распределения

N(x,a,а) = (а4ъп)_1 exp[-(x - a)2 /2ст2]

1 2

при ст = 1, - lnN(x - a) = —(x - a) + C,

12

при ст = 1, a = 0, p(x) = -x + c, y(x) = x ; (7)

2) для двойного экспоненциального распределения

E(x,a, ст) = -2 exp(-o| x - a|)

при ст = 1 -lnE(x - a) = |x - a| + c,

при ст = 1, a = 0 p(x) = Ixl + C,

V(x)

1 при x < 0, 1 при x > 0;

(8)

3) для распределения Коши

Функция Андрюса

при |x| < 2,1л, при |x| > 2,1л.

0 < \x\ < 1,7,

1,7 < \x\ < 3,4,

т'“' 1,7(8,5-|x|)/5,1 при 3,4 < |x| < 8,5,

0 при |x| > 8,5

приписывает крайним наблюдениям упорядоченного ряда такие веса, чтобы максимально снизить действие помех.

Устойчивые алгоритмы нахождения контрольного итога широко применяются при моделировании организационных и технологических процессов. Современное использование этих алгоритмов выполняется в сочетании с классическими процедурами. Можно воспользоваться следующей комбинированной процедурой устойчивого оценивания [4, с.25-26]:

1) оценить контрольные итоги классическим методом наименьших квадратов в предположении соблюдения всех исходных предпосылок;

y(x) =

I sin(x/2,1) 0

Функция Хампеля

= сапґ*

|x| при

1,7 при

K(x,a,ст) = ст/ л(ст2 + (x - a)2) при ст = 1 -lnK(x - a) = ln(1 + (x - a)2) + C,

при ст = 1, a = 0 p(x) = ln(1 + x2) + C,

y(x) = 2x/(1 + x2). (9)

2) выполнить несколько итераций оценивания с использованием функции Хубера и функции Андрюса при константе масштаба 1,5;

3) если результаты оценивания согласно п.1 и 2 совпадают, делаются статистические выводы на основании классических методов МНК; в противном случае за основу берутся “неклассические” решающие правила.

В целях обеспечения надлежащей помехоустойчивости и эффективности оценивания функции у(-), определяемые выражениями (7), (8), (9), преобразуются определенным образом в кусочно-линейные. В практике моделирования широко используются следующие модификации этих функций [1, с.32-137].

Функции Хубера

p(x) =

x2 /2

1,5 x -

y(x) =

2 -1,5

x

1,5

при |x| < 1,5,

2

при Ixl > 1,5,

1,5

при x < -1,5, при |x| < 1,5, при x > 1,5

ориентированы на обработку нормально распределенных результатов наблюдений, которым присущи “утяжеленные хвосты”, подчиненные двойному экспоненциальному закону распределения. В качестве масштаба использовано число 1,5 по той причине, что большинство элементов нормально распределенной выборки удовлетворяет условию |xi -a|/S < 1,5 .

Кусочно-линейная М-оценка параметра положения (сдвига) a определяется неявно как решение уравнения

n x- — a

Q = ZVi(-V-) = 0, (10)

i=1 S

где S — помехоустойчивая оценка параметра масштаба, в качестве которой может быть принята медиана абсолютных отклонений

Sj = MAO(x) = Mв|xi -MB{xi}|/0,6745, i = 1щ

или интерквартельный размах

S2 = HKP(x) = (x0,75 - x0,25) /2 * 0,67 4 5.

Решение уравнения (10) производится при помощи итеративной процедуры. В качестве начального приближения a(0) решения a можно принять медиану исходного ряда наблюдений, а оценкой параметра масштаба S может служить медиана абсолютных отклонений от a(0).

Определим М-оценку Хампеля для ряда наблюдений 1, 2, 3, 4, 5, 6, 7, 8, 8, 10, 53. Выборочная медиана равна x = a(0) = 6,0, а медиана абсолютных отклонений — S(0) = Mв |xi - x| = 2,0. После изменения масштаба по формуле

РИ, 2000, № 3

63

xi = (Xi -a(0))/S0 (11)

получим рдд -2,5; -2,0; -1,5; -1,0; -0,5; 0; 0,5; 1,0; 1,0; 2,0; 23,5, который с учетом функции Хампеля примет вид -1,7; -1,7; -1,5; -1,0; -0,5; 0; 0,5; 1,0; 1,0; 1,7.

Начальное значение невязки решения, вычисляемое по формуле (11), равно Q(0) = -2,2 . Сохраняя

неизменной оценку масштаба S(0) = 2, выбираем

первое приближение оценки a(1) = 5,0 . После проведения аналогичных вычислений получим невязку после первой итерации Q(1) = 1,5 . Изменение знака невязки свидетельствует о том, что искомое

решение расположено в интервале [a(0), a(1) ]. Для

уточнения решения можно воспользоваться методом Ньютона, интерполяционными формулами или выполнить еще несколько итераций.

Результаты выполненных вычислений занесены в табл. 4, из которой следует, что искомое значение устойчивой М-оценки Хампеля при Q(4) = 0 равно a(4) = 5,425.

Таблица 4

Итерации к 0 1 2 3 4

a(K) 6,0 5,0 5,4 5,43 5,425

Q(K) -2,2 1,5 -0,1 0,007 0,000

Различные оценки контрольного итога центра распределения, полученные в настоящей работе, сведены в табл. 5.

Полученные результаты позволяют сделать следующие выводы:

— классические методы обработки результатов наблюдений весьма чувствительны к отклонениям исходных предпосылок эксперимента;

Таблица 5

Процедура оценивания Оценка

Классический МНК х 8,82

Медианная оценка X 6,00

Винзоризованная оценка 6,00

Усеченная оценка при q = 3 5,88

М-оценка Хампеля 5,42

— робастные методы оценивания обеспечивают высокую эффективность обработки данных (за устойчивость оценок при действии импульсных помех приходится расплачиваться пятипроцентной потерей эффективности оценок);

— оценивание параметров в автоматизированных системах целесообразно производить совокупностью алгоритмов, а отбор приемлемых решений - с помощью формализованных процедур или лицом, принимающим решение [4].

Литература: 1. Афифи А., Эйзен С. Статистический анализ. Подход с использованием ЭВМ. М.: Мир, 1982. 488 с. 2. Мостеллер Ф, Тъюки Дж. Анализ данных и регрессия. М.: Финансы и статистика, 1982. Вып. 1. 317с. Вып. 2. 239 с.3. Устойчивые статистические методы оценки данных / Под ред. Р.Л. Лонера и Г.Н. Уилкоксона. М.: Машиностроение, 1984. 232 с. 4. Авраменко В.П. Устойчивые процедуры моделирования технологических процессов. АСУ и приборы автоматики. 1986. Вып. 78. С. 3-9.

Поступила в редколлегию 14.04.2000

Рецензент: д-р техн. наук, проф. Петров Э.Г.

Авраменко Валерий Павлович, д-р техн. наук, профессор кафедры информационных управляющих систем ХТУРЭ. Научные интересы: управление процессами в компьютерных системах, геоинформационные системы. Увлечения: путешествия, садоводство. Адрес: Украина, 61166, Харьков, пр. Ленина, 14, тел. 40-94-51.

Халявин Владимир Александрович, студент группы КСОИУ-95-1 ХТУРЭ. Научные интересы: геоинформационные системы, задачи целочисленного программирования. Увлечения: путешествия, музыка. Адрес: Украина, 61166, Харьков, ул. Бакулина, 10, ком. 429.

УДК 62.52

ОРГАНИЗАЦИЯ ПРОДУКЦИОННЫХ БАЗ ЗНАНИЙ В СИТУАЦИОННЫХ СИСТЕМАХ УПРАВЛЕНИЯ

СЫТНИКБ.Т, КАРАВАНА.Н.______________

Рассматривается задача организации баз знаний для диспетчерского управления движением подвижных еди -ниц на сети городского электротранспорта. В основу ситуационной системы управления реального времени положена модель производственной ситуации, которая на каждый момент времени отражает состояние объекта управления и окружения. Предлагаются механизмы, структуры и правила оценки производственной и модельной ситуации, а также правила модификации параметров модели.

Введение

Существует ряд методов, которые могут быть положены в основу управления перевозочным процессом на полигоне транспортной сети. Это матричные и сетевые модели, сети Петри, теория массового обслуживания и др. Каждый из этих методов имеет свои достоинства и недостатки. Так, для матричных моделей недостатком является большая размерность задачи. Модели массового обслуживания ориентированы на регулярный поток событий, следующих через равные промежутки времени, что нетипично для транспортных задач, где характерно появление нечетких последовательностей событий на участках маршрута. Поэтому решение поставленной задачи актуально в объединении методов искусственного интеллекта, сетевых моделей и ситуационного управления, позволяющих адекватно описать состояния объекта управления и окру-

64

РИ, 2000, № 3

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.