Непараметрический алгоритм распознавания образов для элементов и устройств систем управления

Домрачев В.Г.; Гавриков В.А.; Котов Ю.Т.

- выбросов случайного процесса. Пороговые уровни определяются через требуемые по условию задачи вероятности ошибок 1-го и 2-го родов а и в соответственно [5]

Cl (n) = [ln(\ / ^)] - 1 [ln (Х0 - \) +

+ ln (в / 1 - а)]; (4)

с2 (n) = [ln(\ / ^)] - 1 [In (^ - \) +

+ ln (1 - в / а)]; (5)

Рассмотренный здесь алгоритм распространяется и на сумму независимых случайных величин, распределенных по закону Пуассона, так как результирующий процесс, на основании теории вероятностей, будет также распределен по этому закону.

Наличие у МП и МК аналого-цифровых преобразователей, счетчиков-таймеров реального времени, широтно-импульсных модуляторов позволяет вести обработку встроенной аппаратной частью данных вычислительных устройств, что существенно снижает потребность в вычислительных ресурсах и значительно увеличивает скорость обработки информации.

Одновременно выполняется компрессия измерительной информации, так как обработка ведется только ее существенной, значимой части.

В заключение следует отметить, что алгоритмы обработки измерительной информации базирующихся на характеристиках выбросов случайных процессов отвечают следующим основным требованиям:

1. Адекватность модели реальному измерительному процессу.

2. Небольшая потребность в вычислительных ресурсах (быстродействии, разрядности данных, объемах памяти).

3. Высокая скорость обработки информации.

4. Высокая степень сжатия измерительной информации.

5. Возможность использования встроенных устройств (аналого-цифровых преобразователей, счетчиков-таймеров реального времени, широтно-импульсных модуляторов) микроконтроллеров для снижения потребность в вычислительных ресурсах и значительного увеличения скорости обработки измерительной информации.

Библиографический список

1. Тихонов, В.И. Выбросы случайных процессов / В.И. Тихонов. - М.: Наука, 1987. - 303 с.

2. Фомин, Я.А. Теория выбросов случайных процессов / Я.А. Фомин. - М: Связь, 1980. - 216 с.

3. Левин, Б.Р. Вероятностные характеристики выбросов случайных процессов. - В кн.: Нелинейные и оптимальные системы / Б.Р. Левин, Я.А. Фомин.

- М.: Наука, 1971. - С. 381-392.

4. Рембовский, А.М. Распределение числа пересечений порога случайным процессом / А.М. Рембовский, Я.А. Фомин. - М.: Радиотехника и электроника, 1979. - Т. 24. - № 3. - С. 632-635.

5. Фланаган, Д.Л. Анализ, синтез и восприятие речи / Д.Л. Фланаган. - М.: Связь, 1968. - 397 с.

6. Фу, К. Последовательные методы в распознавании образов и обучении машин. Пер. с англ. / К. Фу.

- М.: Наука, 1971. - 256 с.

НЕПАРАМЕТРИЧЕСКИЙ АЛГОРИТМ РАСПОЗНАВАНИЯ ОБРАЗОВ ДЛЯ ЭЛЕМЕНТОВ И УСТРОЙСТВ СИСТЕМ УПРАВЛЕНИЯ

В.Г. ДОМРАЧЕВ, проф. каф. электроники и микропроцессорной техникиМГУЛ, д-р техн. наук, В.А. ГАВРИКОВ, доц. каф. электроники и микропроцессорной техники МГУЛ, канд. техн. наук, Ю.Т. КОТОВ, проф. каф. электроники и микропроцессорной техники МГУЛ, д-р техн. наук

Применение в системах управления процедур распознавания образов повышает качество и скорость принимаемых человеком решений [1, 2]. Для правильного выбора алгоритма классификации, позволяющего разделять входные образы на классы, не-

[email protected] обходимо учитывать следующие основные факторы:

- совокупность априорных сведений о

нем;

- характер получения информации об исследуемом объекте.

84

ЛЕСНОЙ ВЕСТНИК 6/2012

На практике, однако, часто неизвестен даже тип функций плотностей вероятностей f (X/TOj) и никакие упрощающие предположения не могут быть обоснованы вследствие недостаточной априорной информации об исследуемом объекте или вследствие изменения статистик рабочей среды. Это приводит к необходимости использовать различные модели, например, аппроксимацию аналитических выражений многомерной плотности вероятности f (x,, ... ,x ,t,, ... , t), что является очень сложной задачей. Вместе с тем, использование полученных выражений приводит к неточным, весьма приближенным результатам [3].

В данном случае целесообразно использовать непараметрические методы, для того чтобы получить более адекватную математическую модель конкретной физической ситуации для построения классификатора. При этом не предполагается знание законов распределения, связанных с каждым классом образов, а используются более фундаментальные свойства случайных величин. Это обычно некоторые относительные характеристики - ранги, серии, различные порядковые отношения и т.п.

Непараметрические методы обладают рядом перечисленных ниже преимуществ перед параметрическими [1, 2, 3]:

- более широкое поле приложений, так как они могут применяться для обработки данных, не обладающих количественной природой (нечисловой информации);

- меньшая чувствительность к «засорениям» статистических данных и влиянию грубых ошибок;

- процедуру классификации можно проводить по малым выборкам;

- математические средства здесь намного проще, чем в параметрических методах.

При этом алгоритмы классификации образов в вычислительном отношении не сложны и для их применения не требуется быстродействующий персональный компьютер с большим объемом оперативной памяти. Обработка поступающей информации может осуществляться микропроцессорами и программируемыми микроконтроллерами в реальном масштабе времени.

Так как в ряде случаев, в силу особенностей исследуемого объекта, информация о нем не может быть получена сразу, когда процедура классификации образов протекает во времени. Здесь принятие решения делается не сразу на основании всей полученной информации, а последовательно, шаг за шагом.

В непараметрической процедуре последовательной классификации вектор замеров признаков X = [x1, x2, ... , xn]T заменяется вектором рангов S = [Sp S2, ... , Sn]T.

Измерения признаков x1, x2, ... , xn в системах управления производятся последовательно, и после каждого нового измерения необходимо переопределить ранги для всего множества замеров. «Последовательный ранг» замера xn по отношению к множеству замеров (x1, x2, ... , xn) равен Sn, если xn является S -й наименьшей величиной в этом мно-

n

жестве. Здесь необходимо отметить, что каждый раз при новом измерении, определение ранга осуществляется без переопределения их во всем векторе признаков, т.е. он сохраняется в информации, которая была получена при переопределении рангов всех предшествующих замеров.

Такой порядок определения рангов замеров естественным образом согласуется с процедурой последовательного принятия решений, когда измерения производятся последовательно в соответствии с определенным правилом остановки.

Между множеством и! возможных расстановок x, < x.„ < x.. ... < x и множеством n! возможных векторов последовательных рангов [S1, S2, . , Sn] для вектора замеров X = [x1, x2, ... , xn]T имеется взаимно однозначное соответствие [4].

В непараметрических статистиках между порядком замеров (следовательно, и вектором простых рангов) и вектором последовательных рангов существует взаимно однозначное соответствие. Отсюда следует, что можно вычислить распределение векторов последовательных рангов [4]

= \ -JfHfo). (i)

-oo<^<---<Xjn<oo 7-1

ЛЕСНОЙ ВЕСТНИК 6/2012

85

фйстД

где Р.х.) - функция распределения независимых переменных х...

В случае, когда функции распределения P. (х) удовлетворяют альтернативам Лемана (r. > 0), получим

г Pt(xt)=Pr- (х)=[P(х)]r, (2)

откуда, дифференцируя (2), получим

dp(х )=dPr (х)=rP 1 (х)dP(x). (3)

Подставим (3) в (1), будем иметь

Р(х1<х2<...<хп)=

= 1 (4) -оо<Х1<-"<Хи<оо 1-1

Введем обозначение y. = P(x) и подставим (4) в (3), получим

Р(х,<х,<-<х„)=

Г Ггт ПЧ

S -jrbw-TfW (5)

П 2>,

-азйуй-"<,у<«> *-1

,=1 у j=1 J

Из выражения (5) можно найти вероятность для любой расстановки величин х;, переставляя их в формуле соответственным образом, а из соотношения (1) определить распределение векторов последовательных рангов.

В качестве основной модели для разработки непараметрического алгоритма последовательной классификации рассмотрим задачу последовательного испытания двух выборок. Допустим, что при проведении распознавания электропроводящих объектов имеется два вектора замеров

X = [хр ^ ... , х/ и Y = [урУ2, ... , ynY, (6) каждый из которых представляет собой выборку из ансамбля случайных величин с некоторым распределением вероятностей. При этом должно использоваться как можно меньшее число измерений.

Далее предполагается, что последовательные замеры х1, х2, ... , хп и у1, y2, ... yn - независимые случайные величины. Такое предположение вполне допустимо, так как при наличии «сильной» взаимосвязи между признаками можно применить метод агрегирования параметров, т.е. укрупненное представление группы показателей в виде одного обобщенного признака [1, 3]. Указанный подход позволяет оценивать информативность

различных групп признаков раздельно, как бы расчленяя пространства описаний большой размерности на ряд подпространств меньшей размерности.

Испытывается гипотеза, что оба этих распределения одинаковы

H : G = P(X) (6)

и альтернатива, что они различны H1: G = fP(X)) = Pr(X)в предположении, что P(X) - функция распределения X и f (P(X)) - функция распределения Y. Для использования последовательного критерия отношения вероятностей (ПКОВ) Вальда, основанного на последовательных рангах, расставим замеры в таком порядке, чтобы они чередовались: х

У1, x2, У 2:) "' , xn, Уп.

Обозначим объединенные замеры на k-м шаге вектором

V(k) = [Vl, V2,...,VkL (7)

где v1 = х1, v2 = у 1 и т.д.

Пусть S(k) = [S1, S2, , Sk] есть вектор последовательных рангов для V(k).

\ = ртщм Pk(S(k)/H0)l (8)

Выражение (8) представляет собой последовательное отношение вероятностей на k-м шаге процедуры классификации. Если верна гипотеза H то для произвольного вектора S из S(k) имеем

P[S(k) = S/ H0] = 1/k!

Из выражения (8) для четных k получим

P(S (k у H) = P(S, S2 ..... Sk/H,) =

где

k/ 2

k ( i \

П Z4

1 =1 V 1 =1 J

(10)

Aj =

1, если Vj есть х, г, если Vj есть у.

(11)

Тогда, последовательное отношение вероятностей на (k+1) - м шаге можно определить из выражений: для четных k

-

(k +1) !• r

(k+1у 2

k+1 St+l -1 ( i \ k ( i

П Z 4 • П r+14

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

1-1 V1-1 J i-Sk+1-1 V 1-1 J

Mf-e|. (12)

86

ЛЕСНОЙ ВЕСТНИК 6/2012

для нечетных к,

Х1г М —

(к +1) !• rk/ 2

к+1 SM-1 ( , \ к ( ,

П Л A • П 1+Л a

'—1 V j—1 У '—Sk+i-1V j—1 У

. (13)

Для завершения непараметрической процедуры достаточно иметь только пару останавливающих границ, с которыми сравниваются последовательные отношения вероятностей

A = (1 - Р01) / Рю и B = Р01 / (1 - Рш)> (14) где p.. - вероятность принятия гипотезы H,,

когда в действительности верна гипотеза H.

j

Таким образом, непараметрическая процедура ПКОВ сводится к следующим шагам.

Получить последовательный ранг (к+ 1)-го замера.

Образовать вектор A(k+1) = [A1, A2, ..., AZ1, A*, AZ+V ..., Ak], содержащий (k+1) элементов, где A* = 1, если (к+1)-й замер есть x, и A* = r, если у, из Ak = [A 1, A2, ..., Ak] и вычислить ^к+1-

Вычислить последовательное отношение вероятностей Хк+1 по формуле (12) или (13) и сравнить с останавливающими границами (14).

На рисунке представлена блок-схема алгоритма непараметрической процедуры распознавания образов.

Правильный выбор альтернативы Лемана существенно влияет на качество алгоритма последовательной классификации. Между параметром г и средним числом измерений существует определенная зависимость [4]

(r-V2 + r12 У-1

E,. (к) —

log-

2

X

e10 • log (1 -‘° Ч + 0 - e10 (1 e01)

)• log

(1- ei0 )

e°1

. (15)

Если выполняется условие e1° « i, то (9) можно записать в виде

E,. (k) s

l°g[(l - e1° )/ e01 ]

, (r ~'/2 + У2)’

log--------------

(16)

выражение (15) дает приближенную связь между средним числом измерений Er(k) и параметром альтернативы Лемана r при заданных вероятностях e01 и e10.

Из (15) и (16) можно сделать вывод, что при r > 1 и r < 1 среднее число измерений Er(k) уменьшается по мере удаления от значения r = 1.

Рассмотрим числовой пример непараметрической процедуры классификации, данные для которого были получены с матричного электромагнитного преобразователя с размерами 100 х 100 мм и имеющего 16 х 16 ячеек. В результате проведенных измерений было получено две выборки образов X и Y, каждая выборка представлена 16-мерным

Рисунок. Блок-схема алгоритма непараметрической процедуры распознавания образов

ЛЕСНОЙ ВЕСТНИК 6/2012

87

фйстД

вектором, элементы которого последовательно измеряются классификатором. Выборки получены для различных контролируемых объектов.

X = [x^ X2, "' , Х16] =

[6,3; 6,9; 7,3; 7,5; 7,4; 6,8; 6,2; 6,7; 8,6; 9,5; 8,2; 7,2 ;7,2; 9,0; 10,8; 9,9];

Y = -V-У16] =

[6,0; 7,0; 8,0; 9,0; 9,0; 8,0; 7,0; 7,0; 8,0; 9,0; 8,0; 7,0; 7,0; 10,0; 10,0; 9,0]. Объединенная выборка замера имеет

вид

V (32) = К V",V32] = [xl, Ур x2, , У2,",xl6, У16]-

Допустим, что вектор Y принадлежит классу образов Q. Задача состоит в проверке, принадлежит ли вектор X тому же классу, что и вектор Y. используя как можно меньше измерений. Положим r = 0,5 в альтернативе Лемана против гипотезы Н0 (г = 1), а вероятности р10 = р01 = 0,1. Тогда останавливающие границы в последовательном критерии отношения вероятностей (ПКОВ) Вальда равны

А = (1 - Ро1) /Рю = 9,0 и В = Ро1 / (1 - Р10) = 0,11.

Из (12) и (13) с помощью последовательных рангов объединенных замеров вычисляются последовательные отношения вероятностей

V(1) = [6,3]; S(1) = [1];

A(1) = A = [1]; * = 1,00;

V(2) = [6,3;6,0]; S(2) = [2;1];

A (2) = [0,5;1]; A1 = 0,5; A2 = 1; * = 1,33; V(3) = [6,3;6,0;6,9];

S(3) = [2;1;3]; A(3) = [0,5;1;1];

A1 = 0,5; A2 = 1; A3 = 1; * = 1,60;

V(4) = [6,3;6,0;6,9;7,0];

S(4) = [2;1;3;4]; A(4) = [0,5;1;1;0,5];

A1 = 0,5; A2 = 1; A3 = 1; A4 = 0,5; * = 1,07; V(5) = [6,3;6,0;6,9;7,0;7,3]; S(5) = [2;1;3;4;5]; A(5) = [0,5;1;1;0,5;1];

A1 = 0,5; A2 = 1; A3 = 1;

A4 = 0,5; A5 = 1; * = 1,33;

V(6) = [6,3;6,0;6,9;7,0;7,3;8,0];

S(6) = [2;1;3;4;5;6];

A(6) = [0,5;1;1;0,5;1;0,5];

A1 = 0,5; A2 = 1; A3 = 1; A4 = 0,5;

A5 = 1; A6 = 0,5; * = 0,89;

V(7) = [6,3;6,0;6,9;7,0;7,3;8,0;7,6];

S(7) = [2;1;3;4;5;7;6];

A(7) = [0,5;1;1;0,5;1;1;0,5];

A1 = 0,5; A2 = 1; A3 = 1; A4 = 0,5;

A5 = 1; A6 = 1; A7 = 0,5; * = 1,0, аналогично, получим

*8 = 0,68; * = 0,74; Xw = 0,49;

*11 = 0,44; \2 = 0,30; ^ = 0,27;

*14 = 0,23; Д5 = 0,20; ^ = 0,16;

*17 = 0,19; Д8 = 0,18; = 0,18;

*20 = 0,12; *21 = 0,14 *22 = 0,10. Поскольку *22 < B = 0,11, классификатор принимает на одиннадцатом замере выборки X неизвестного образа гипотезу H0. В результате можно сделать вывод о том, что образ принадлежит классу Q т.е. является линейно протяженным изделием.

По полученным результатам можно сделать следующие основные выводы.

- При недостаточной априорной информации об исследуемом объекте целесообразно использовать непараметрические методы, для того чтобы получить более адекватную математическую модель конкретной физической ситуации для построения классификатора.

- Процедуру классификации можно проводить по небольшим выборкам.

- Математические процедуры в данном случае намного проще, чем при параметрических методах классификации.

- Полученные количественные результаты контроля позволяют отображать их в наглядной и удобной для оператора форме.

- Применение непараметрических методов классификации позволяет повысить достоверность и скорость принимаемых человеком решений.

Библиографический список

1. Ту, Дж. Принципы распознавания образов / Дж. Ту, Р. Гонсалес. - М.: Мир, 1978. - 410 с.

2. Гублер, Е.В. Применение непараметрических критериев статистики в медико-биологических исследованиях / Е.В. Гублер, А.А. Генкин. - Л.: Медицина, 1973. - 128 с.

3. Рунион, Р. Справочник по непараметрической статистике / Р. Рунион. - М.: Финансы и статистика, 1982. - 142 с.

4. Фу, К. Последовательные методы в распознавании образов и обучении машин / К. Фу. - М.: Наука, 1971. - 226 с.

5. Фомин, Я.А. Теория выбросов случайных процессов / Я.А. Фомин. - М.: Связь, 1987. - 215 с.

88

ЛЕСНОЙ ВЕСТНИК 6/2012

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Домрачев В. Г., Гавриков В. А., Котов Ю. Т.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Домрачев В. Г., Гавриков В. А., Котов Ю. Т.

Текст научной работы на тему «Непараметрический алгоритм распознавания образов для элементов и устройств систем управления»