- выбросов случайного процесса. Пороговые уровни определяются через требуемые по условию задачи вероятности ошибок 1-го и 2-го родов а и в соответственно [5]
Cl (n) = [ln(\ / ^)] - 1 [ln (Х0 - \) +
+ ln (в / 1 - а)]; (4)
с2 (n) = [ln(\ / ^)] - 1 [In (^ - \) +
+ ln (1 - в / а)]; (5)
Рассмотренный здесь алгоритм распространяется и на сумму независимых случайных величин, распределенных по закону Пуассона, так как результирующий процесс, на основании теории вероятностей, будет также распределен по этому закону.
Наличие у МП и МК аналого-цифровых преобразователей, счетчиков-таймеров реального времени, широтно-импульсных модуляторов позволяет вести обработку встроенной аппаратной частью данных вычислительных устройств, что существенно снижает потребность в вычислительных ресурсах и значительно увеличивает скорость обработки информации.
Одновременно выполняется компрессия измерительной информации, так как обработка ведется только ее существенной, значимой части.
В заключение следует отметить, что алгоритмы обработки измерительной информации базирующихся на характеристиках выбросов случайных процессов отвечают следующим основным требованиям:
1. Адекватность модели реальному измерительному процессу.
2. Небольшая потребность в вычислительных ресурсах (быстродействии, разрядности данных, объемах памяти).
3. Высокая скорость обработки информации.
4. Высокая степень сжатия измерительной информации.
5. Возможность использования встроенных устройств (аналого-цифровых преобразователей, счетчиков-таймеров реального времени, широтно-импульсных модуляторов) микроконтроллеров для снижения потребность в вычислительных ресурсах и значительного увеличения скорости обработки измерительной информации.
Библиографический список
1. Тихонов, В.И. Выбросы случайных процессов / В.И. Тихонов. - М.: Наука, 1987. - 303 с.
2. Фомин, Я.А. Теория выбросов случайных процессов / Я.А. Фомин. - М: Связь, 1980. - 216 с.
3. Левин, Б.Р. Вероятностные характеристики выбросов случайных процессов. - В кн.: Нелинейные и оптимальные системы / Б.Р. Левин, Я.А. Фомин.
- М.: Наука, 1971. - С. 381-392.
4. Рембовский, А.М. Распределение числа пересечений порога случайным процессом / А.М. Рембовский, Я.А. Фомин. - М.: Радиотехника и электроника, 1979. - Т. 24. - № 3. - С. 632-635.
5. Фланаган, Д.Л. Анализ, синтез и восприятие речи / Д.Л. Фланаган. - М.: Связь, 1968. - 397 с.
6. Фу, К. Последовательные методы в распознавании образов и обучении машин. Пер. с англ. / К. Фу.
- М.: Наука, 1971. - 256 с.
НЕПАРАМЕТРИЧЕСКИЙ АЛГОРИТМ РАСПОЗНАВАНИЯ ОБРАЗОВ ДЛЯ ЭЛЕМЕНТОВ И УСТРОЙСТВ СИСТЕМ УПРАВЛЕНИЯ
В.Г. ДОМРАЧЕВ, проф. каф. электроники и микропроцессорной техникиМГУЛ, д-р техн. наук, В.А. ГАВРИКОВ, доц. каф. электроники и микропроцессорной техники МГУЛ, канд. техн. наук, Ю.Т. КОТОВ, проф. каф. электроники и микропроцессорной техники МГУЛ, д-р техн. наук
Применение в системах управления процедур распознавания образов повышает качество и скорость принимаемых человеком решений [1, 2]. Для правильного выбора алгоритма классификации, позволяющего разделять входные образы на классы, не-
[email protected] обходимо учитывать следующие основные факторы:
- совокупность априорных сведений о
нем;
- характер получения информации об исследуемом объекте.
84
ЛЕСНОЙ ВЕСТНИК 6/2012
На практике, однако, часто неизвестен даже тип функций плотностей вероятностей f (X/TOj) и никакие упрощающие предположения не могут быть обоснованы вследствие недостаточной априорной информации об исследуемом объекте или вследствие изменения статистик рабочей среды. Это приводит к необходимости использовать различные модели, например, аппроксимацию аналитических выражений многомерной плотности вероятности f (x,, ... ,x ,t,, ... , t), что является очень сложной задачей. Вместе с тем, использование полученных выражений приводит к неточным, весьма приближенным результатам [3].
В данном случае целесообразно использовать непараметрические методы, для того чтобы получить более адекватную математическую модель конкретной физической ситуации для построения классификатора. При этом не предполагается знание законов распределения, связанных с каждым классом образов, а используются более фундаментальные свойства случайных величин. Это обычно некоторые относительные характеристики - ранги, серии, различные порядковые отношения и т.п.
Непараметрические методы обладают рядом перечисленных ниже преимуществ перед параметрическими [1, 2, 3]:
- более широкое поле приложений, так как они могут применяться для обработки данных, не обладающих количественной природой (нечисловой информации);
- меньшая чувствительность к «засорениям» статистических данных и влиянию грубых ошибок;
- процедуру классификации можно проводить по малым выборкам;
- математические средства здесь намного проще, чем в параметрических методах.
При этом алгоритмы классификации образов в вычислительном отношении не сложны и для их применения не требуется быстродействующий персональный компьютер с большим объемом оперативной памяти. Обработка поступающей информации может осуществляться микропроцессорами и программируемыми микроконтроллерами в реальном масштабе времени.
Так как в ряде случаев, в силу особенностей исследуемого объекта, информация о нем не может быть получена сразу, когда процедура классификации образов протекает во времени. Здесь принятие решения делается не сразу на основании всей полученной информации, а последовательно, шаг за шагом.
В непараметрической процедуре последовательной классификации вектор замеров признаков X = [x1, x2, ... , xn]T заменяется вектором рангов S = [Sp S2, ... , Sn]T.
Измерения признаков x1, x2, ... , xn в системах управления производятся последовательно, и после каждого нового измерения необходимо переопределить ранги для всего множества замеров. «Последовательный ранг» замера xn по отношению к множеству замеров (x1, x2, ... , xn) равен Sn, если xn является S -й наименьшей величиной в этом мно-
n
жестве. Здесь необходимо отметить, что каждый раз при новом измерении, определение ранга осуществляется без переопределения их во всем векторе признаков, т.е. он сохраняется в информации, которая была получена при переопределении рангов всех предшествующих замеров.
Такой порядок определения рангов замеров естественным образом согласуется с процедурой последовательного принятия решений, когда измерения производятся последовательно в соответствии с определенным правилом остановки.
Между множеством и! возможных расстановок x, < x.„ < x.. ... < x и множеством n! возможных векторов последовательных рангов [S1, S2, . , Sn] для вектора замеров X = [x1, x2, ... , xn]T имеется взаимно однозначное соответствие [4].
В непараметрических статистиках между порядком замеров (следовательно, и вектором простых рангов) и вектором последовательных рангов существует взаимно однозначное соответствие. Отсюда следует, что можно вычислить распределение векторов последовательных рангов [4]
= \ -JfHfo). (i)
-oo<^<---<Xjn<oo 7-1
ЛЕСНОЙ ВЕСТНИК 6/2012
85
фйстД
где Р.х.) - функция распределения независимых переменных х...
В случае, когда функции распределения P. (х) удовлетворяют альтернативам Лемана (r. > 0), получим
г Pt(xt)=Pr- (х)=[P(х)]r, (2)
откуда, дифференцируя (2), получим
dp(х )=dPr (х)=rP 1 (х)dP(x). (3)
Подставим (3) в (1), будем иметь
Р(х1<х2<...<хп)=
= 1 (4) -оо<Х1<-"<Хи<оо 1-1
Введем обозначение y. = P(x) и подставим (4) в (3), получим
Р(х,<х,<-<х„)=
Г Ггт ПЧ
S -jrbw-TfW (5)
П 2>,
-азйуй-"<,у<«> *-1
,=1 у j=1 J
Из выражения (5) можно найти вероятность для любой расстановки величин х;, переставляя их в формуле соответственным образом, а из соотношения (1) определить распределение векторов последовательных рангов.
В качестве основной модели для разработки непараметрического алгоритма последовательной классификации рассмотрим задачу последовательного испытания двух выборок. Допустим, что при проведении распознавания электропроводящих объектов имеется два вектора замеров
X = [хр ^ ... , х/ и Y = [урУ2, ... , ynY, (6) каждый из которых представляет собой выборку из ансамбля случайных величин с некоторым распределением вероятностей. При этом должно использоваться как можно меньшее число измерений.
Далее предполагается, что последовательные замеры х1, х2, ... , хп и у1, y2, ... yn - независимые случайные величины. Такое предположение вполне допустимо, так как при наличии «сильной» взаимосвязи между признаками можно применить метод агрегирования параметров, т.е. укрупненное представление группы показателей в виде одного обобщенного признака [1, 3]. Указанный подход позволяет оценивать информативность
различных групп признаков раздельно, как бы расчленяя пространства описаний большой размерности на ряд подпространств меньшей размерности.
Испытывается гипотеза, что оба этих распределения одинаковы
H : G = P(X) (6)
и альтернатива, что они различны H1: G = fP(X)) = Pr(X)в предположении, что P(X) - функция распределения X и f (P(X)) - функция распределения Y. Для использования последовательного критерия отношения вероятностей (ПКОВ) Вальда, основанного на последовательных рангах, расставим замеры в таком порядке, чтобы они чередовались: х
У1, x2, У 2:) "' , xn, Уп.
Обозначим объединенные замеры на k-м шаге вектором
V(k) = [Vl, V2,...,VkL (7)
где v1 = х1, v2 = у 1 и т.д.
Пусть S(k) = [S1, S2, , Sk] есть вектор последовательных рангов для V(k).
\ = ртщм Pk(S(k)/H0)l (8)
Выражение (8) представляет собой последовательное отношение вероятностей на k-м шаге процедуры классификации. Если верна гипотеза H то для произвольного вектора S из S(k) имеем
P[S(k) = S/ H0] = 1/k!
Из выражения (8) для четных k получим
P(S (k у H) = P(S, S2 ..... Sk/H,) =
где
k/ 2
k ( i \
П Z4
1 =1 V 1 =1 J
(10)
Aj =
1, если Vj есть х, г, если Vj есть у.
(11)
Тогда, последовательное отношение вероятностей на (k+1) - м шаге можно определить из выражений: для четных k
-
(k +1) !• r
(k+1у 2
k+1 St+l -1 ( i \ k ( i
П Z 4 • П r+14
1-1 V1-1 J i-Sk+1-1 V 1-1 J
Mf-e|. (12)
86
ЛЕСНОЙ ВЕСТНИК 6/2012
для нечетных к,
Х1г М —
(к +1) !• rk/ 2
к+1 SM-1 ( , \ к ( ,
П Л A • П 1+Л a
'—1 V j—1 У '—Sk+i-1V j—1 У
. (13)
Для завершения непараметрической процедуры достаточно иметь только пару останавливающих границ, с которыми сравниваются последовательные отношения вероятностей
A = (1 - Р01) / Рю и B = Р01 / (1 - Рш)> (14) где p.. - вероятность принятия гипотезы H,,
когда в действительности верна гипотеза H.
j
Таким образом, непараметрическая процедура ПКОВ сводится к следующим шагам.
Получить последовательный ранг (к+ 1)-го замера.
Образовать вектор A(k+1) = [A1, A2, ..., AZ1, A*, AZ+V ..., Ak], содержащий (k+1) элементов, где A* = 1, если (к+1)-й замер есть x, и A* = r, если у, из Ak = [A 1, A2, ..., Ak] и вычислить ^к+1-
Вычислить последовательное отношение вероятностей Хк+1 по формуле (12) или (13) и сравнить с останавливающими границами (14).
На рисунке представлена блок-схема алгоритма непараметрической процедуры распознавания образов.
Правильный выбор альтернативы Лемана существенно влияет на качество алгоритма последовательной классификации. Между параметром г и средним числом измерений существует определенная зависимость [4]
(r-V2 + r12 У-1
E,. (к) —
log-
2
X
e10 • log (1 -‘° Ч + 0 - e10 (1 e01)
)• log
(1- ei0 )
e°1
. (15)
Если выполняется условие e1° « i, то (9) можно записать в виде
E,. (k) s
l°g[(l - e1° )/ e01 ]
, (r ~'/2 + У2)’
log--------------
(16)
выражение (15) дает приближенную связь между средним числом измерений Er(k) и параметром альтернативы Лемана r при заданных вероятностях e01 и e10.
Из (15) и (16) можно сделать вывод, что при r > 1 и r < 1 среднее число измерений Er(k) уменьшается по мере удаления от значения r = 1.
Рассмотрим числовой пример непараметрической процедуры классификации, данные для которого были получены с матричного электромагнитного преобразователя с размерами 100 х 100 мм и имеющего 16 х 16 ячеек. В результате проведенных измерений было получено две выборки образов X и Y, каждая выборка представлена 16-мерным
Рисунок. Блок-схема алгоритма непараметрической процедуры распознавания образов
ЛЕСНОЙ ВЕСТНИК 6/2012
87
фйстД
вектором, элементы которого последовательно измеряются классификатором. Выборки получены для различных контролируемых объектов.
X = [x^ X2, "' , Х16] =
[6,3; 6,9; 7,3; 7,5; 7,4; 6,8; 6,2; 6,7; 8,6; 9,5; 8,2; 7,2 ;7,2; 9,0; 10,8; 9,9];
Y = -V-У16] =
[6,0; 7,0; 8,0; 9,0; 9,0; 8,0; 7,0; 7,0; 8,0; 9,0; 8,0; 7,0; 7,0; 10,0; 10,0; 9,0]. Объединенная выборка замера имеет
вид
V (32) = К V",V32] = [xl, Ур x2, , У2,",xl6, У16]-
Допустим, что вектор Y принадлежит классу образов Q. Задача состоит в проверке, принадлежит ли вектор X тому же классу, что и вектор Y. используя как можно меньше измерений. Положим r = 0,5 в альтернативе Лемана против гипотезы Н0 (г = 1), а вероятности р10 = р01 = 0,1. Тогда останавливающие границы в последовательном критерии отношения вероятностей (ПКОВ) Вальда равны
А = (1 - Ро1) /Рю = 9,0 и В = Ро1 / (1 - Р10) = 0,11.
Из (12) и (13) с помощью последовательных рангов объединенных замеров вычисляются последовательные отношения вероятностей
V(1) = [6,3]; S(1) = [1];
A(1) = A = [1]; * = 1,00;
V(2) = [6,3;6,0]; S(2) = [2;1];
A (2) = [0,5;1]; A1 = 0,5; A2 = 1; * = 1,33; V(3) = [6,3;6,0;6,9];
S(3) = [2;1;3]; A(3) = [0,5;1;1];
A1 = 0,5; A2 = 1; A3 = 1; * = 1,60;
V(4) = [6,3;6,0;6,9;7,0];
S(4) = [2;1;3;4]; A(4) = [0,5;1;1;0,5];
A1 = 0,5; A2 = 1; A3 = 1; A4 = 0,5; * = 1,07; V(5) = [6,3;6,0;6,9;7,0;7,3]; S(5) = [2;1;3;4;5]; A(5) = [0,5;1;1;0,5;1];
A1 = 0,5; A2 = 1; A3 = 1;
A4 = 0,5; A5 = 1; * = 1,33;
V(6) = [6,3;6,0;6,9;7,0;7,3;8,0];
S(6) = [2;1;3;4;5;6];
A(6) = [0,5;1;1;0,5;1;0,5];
A1 = 0,5; A2 = 1; A3 = 1; A4 = 0,5;
A5 = 1; A6 = 0,5; * = 0,89;
V(7) = [6,3;6,0;6,9;7,0;7,3;8,0;7,6];
S(7) = [2;1;3;4;5;7;6];
A(7) = [0,5;1;1;0,5;1;1;0,5];
A1 = 0,5; A2 = 1; A3 = 1; A4 = 0,5;
A5 = 1; A6 = 1; A7 = 0,5; * = 1,0, аналогично, получим
*8 = 0,68; * = 0,74; Xw = 0,49;
*11 = 0,44; \2 = 0,30; ^ = 0,27;
*14 = 0,23; Д5 = 0,20; ^ = 0,16;
*17 = 0,19; Д8 = 0,18; = 0,18;
*20 = 0,12; *21 = 0,14 *22 = 0,10. Поскольку *22 < B = 0,11, классификатор принимает на одиннадцатом замере выборки X неизвестного образа гипотезу H0. В результате можно сделать вывод о том, что образ принадлежит классу Q т.е. является линейно протяженным изделием.
По полученным результатам можно сделать следующие основные выводы.
- При недостаточной априорной информации об исследуемом объекте целесообразно использовать непараметрические методы, для того чтобы получить более адекватную математическую модель конкретной физической ситуации для построения классификатора.
- Процедуру классификации можно проводить по небольшим выборкам.
- Математические процедуры в данном случае намного проще, чем при параметрических методах классификации.
- Полученные количественные результаты контроля позволяют отображать их в наглядной и удобной для оператора форме.
- Применение непараметрических методов классификации позволяет повысить достоверность и скорость принимаемых человеком решений.
Библиографический список
1. Ту, Дж. Принципы распознавания образов / Дж. Ту, Р. Гонсалес. - М.: Мир, 1978. - 410 с.
2. Гублер, Е.В. Применение непараметрических критериев статистики в медико-биологических исследованиях / Е.В. Гублер, А.А. Генкин. - Л.: Медицина, 1973. - 128 с.
3. Рунион, Р. Справочник по непараметрической статистике / Р. Рунион. - М.: Финансы и статистика, 1982. - 142 с.
4. Фу, К. Последовательные методы в распознавании образов и обучении машин / К. Фу. - М.: Наука, 1971. - 226 с.
5. Фомин, Я.А. Теория выбросов случайных процессов / Я.А. Фомин. - М.: Связь, 1987. - 215 с.
88
ЛЕСНОЙ ВЕСТНИК 6/2012