УДК 004.032.2; 004.932
модифицированный алгоритм обнаружения разладки случайного процесса и его применение при обработке многоспектральных данных
И. А. Козинов,
канд. техн. наук Г. Н. Мальцев,
доктор техн. наук, профессор
Военно-космическая академия им. А. Ф. Можайского, г. Санкт-Петербург
Рассмотрено использование алгоритмов обнаружения разладки случайного процесса при обработке данных, полученных системами сбора информации. Исходные данные представляют собой функцию изменения по некоторой координате анализируемого параметра, по которой определяются координаты его существенного (скачкообразного) изменения. Представлено решение задачи обнаружения последовательности скачков анализируемой функции в виде решающей статистики для оценки максимального правдоподобия координат скачков с использованием модифицированного алгоритма кумулятивных сумм с настраиваемым скользящим окном. Приводится пример применения предложенного модифицированного алгоритма обнаружения разладки при обработке данных многоспектрального дистанционного зондирования и определении наиболее информативных спектральных каналов.
Ключевые слова — обработка данных, разладка случайного процесса, максимум правдоподобия, алгоритм кумулятивных сумм, многоспектральное дистанционное зондирование.
Введение
Задача обнаружения разладки (изменения свойств) стохастических сигналов и динамики систем является одной из широко распространенных задач анализа и обработки информации [14]. К ней сводятся многие прикладные задачи обработки данных, полученных системами сбора информации, такими как системы дистанционного зондирования, телеметрии, контроля технологических процессов и др. Обнаружение изменения свойств является составной частью анализа сигналов и динамических систем, оно представляет основу алгоритмов распознавания образов, контроля и технической диагностики информа-ционно-управляющих систем, а также дополняет адаптивные процедуры идентификации состояния систем со сложной динамикой.
При формальной постановке задачи обнаружения существенных изменений свойств случайных процессов под разладкой понимают скачкообразное изменение описывающих этот процесс параметров, происходящее в неизвестный момент изменения процесса по той или иной коор-
динате, в большинстве случаев — во времени [14]. Задачей обнаружения разладки является установление факта разладки, и если считается, что разладка произошла, — оценивание момента разладки. Исходными для решения задачи обнаружения разладки являются данные о распределениях значений анализируемого процесса до и после возможной разладки, реализация случайного процесса, а в некоторых случаях также априорные распределения на множестве неизвестных параметров, одним из которых может быть координата момента разладки.
В то же время «классический» математический аппарат обнаружения разладки, основанный на алгоритме вычисления кумулятивных сумм [1, 2], позволяет обнаруживать однократную разладку случайного процесса и получать оценку максимального правдоподобия координат скачка. Кроме того, в большинстве прикладных задач обработки данных необходимо обнаружение последовательности скачков анализируемой функции. Для решения таких задач в настоящей работе предложен модифицированный алгоритм обнаружения последовательности скачков ана-
лизируемой функции на основе вычисления кумулятивных сумм с настраиваемым скользящим окном и показано его применение при анализе данных многоспектрального дистанционного зондирования.
Общее решение задачи обнаружения разладки с использованием алгоритма вычисления кумулятивных сумм
Пусть в качестве анализируемой выступает функция /(х) координаты х, заданная в виде совокупности М дискретных составляющих /т, каждая из которых соответствует координате хт, т = 1, ..., М. Необходимо определить моменты разладки, в качестве которых выбираются значения координат хт, соответствующие областям, в которых функция /(х) претерпевает явно выраженные изменения (резкое увеличение или уменьшение, локальные максимальные и минимальные значения). Эти области могут быть найдены методами поиска скачков в анализируемой функции, удовлетворяющих некоторому критерию. В качестве такого критерия при известных допущениях о функции потерь будем использовать критерий максимального правдоподобия, позволяющий получить оценки максимального правдоподобия моментов (координат) изменения свойств анализируемых процессов [1, 2].
Для того чтобы определить на некотором интервале изменения координаты х скачок функции /(х), представленной составляющими /1, ..., /м, необходимо в каждой координате хт, т = 1, ..., М, последовательно проверить выполнение двух гипотез: Н0 и Н1. Гипотеза Н0 состоит в том, что вся совокупность составляющих /1, ..., /м соответствует одной и той же модели Во. Гипотеза Н1 состоит в том, что совокупность составляющих /1, ..., /к соответствует одной модели В0, а совокупность составляющих /к + 1, ..., /м соответствует другой модели В1. Модели Во и В1 в общем случае пара-метризированы некоторым вектором. Если гипотеза В1 истина, то координата хк принимается за момент скачка (существенного изменения) функции /(х). При равномерной дискретизации это эквивалентно определению номера £ координаты хк, в которой обнаружен скачок, йе[1, ..., М].
Совокупность составляющих дискретной функции /(х) в области анализа /1 , ., /м может быть представлена как последовательность независимых случайных гауссовых величин с параметрами: дисперсией ст2 и кусочно-постоянным средним / которое скачкообразно изменяется при переходе от одной дискретной координаты хт к другой [3]. Обнаружение скачка в точке с координатой хк эквивалентно принятию для анализируемой функции в этой точке гипотезы Н1, когда
она проверяется против гипотезы Н0. Поиск (просмотр) начинается в точке с координатой Хі и осуществляется в направлении увеличения номера т. Тем самым решается задача обнаружения однократной разладки. После обнаружения первого скачка в точке с координатой хк процедура поиска скачка повторяется и продолжает осуществляться в направлении увеличения номера т, начинаясь в точке с координатой хк + ^ В результате решается задача обнаружения многократной разладки — последовательно обнаруживаются все скачки (значимые изменения) дискретной функции /(.х).
В рамках допущения о гауссовой статистике составляющих fv ..., /к анализируемой функции /(х) с помощью последовательных алгоритмов обнаружения разладки могут быть получены оценки моментов разладки, удовлетворяющие критерию максимального правдоподобия. Логарифм отношения правдоподобия различения гипотез Но и Ні при гауссовом распределении дискретных составляющих функции /(х) для координаты скачка хк, задаваемой ее номером к, при выполнении условия независимости составляющих принимает вид
V М
АС*)=^ Е
т=*
V;
т -т;о-~2
(1)
где V/ = Ц/о - т/і с учетом знака есть величина скачка функции, представленной составляющими /і, ..., /м, в анализируемой точке, / — среднее до скачка, / — среднее после скачка; ст^ — дисперсия значений /і, ..., /м анализируемого ряда. Полагается, что изменение свойств связано с изменением кусочно-постоянного среднего / которое изменяет свое значение с Ц/о на Цд, а дисперсия ст2 при переходе через точку скачка не изменяется.
Критерием качества проверки гипотез Но и Ні является стандартный для задач различения сигналов [і, 5] критерий идеального наблюдателя, которому соответствуют и минимум суммы вероятностей ошибок первого и второго рода (соответственно а и Р). Соответствующий алгоритм реализуется при сравнении логарифма отношения правдоподобия Л(к) с порогом, выбираемым исходя из условия минимума суммы вероятностей а и Р или их заданных значений. Критерием качества оценки координаты скачка является максимум логарифма отношения правдоподобия Л(к).
За неизвестную координату скачка хк принимается координата х*, задаваемая оценкой максимального правдоподобия номера точки *, в которой выполняется гипотеза Ні. С учетом выражения (і) оценка максимального правдоподобия * может быть записана в виде
М
* = а^шах V ; ,'ГЛ
т=*
(2)
а правило принятия решения о наличии скачка в точке к — решающая статистика — определяется следующим образом:
М
ёк = Л(*) = шах V; Е
т=*
V;
;т — о 2
Ні
>
<
Но
8, (3)
где 5 — порог, выбираемый исходя из выбранного критерия; ке[1, ..., М]. В выражениях (2) и (3) проверка условия максимизации функции правдоподобия Л(к) и ее сравнение с порогом осуществляются с учетом значений дискретной функции /(х) для всех координат хт, т = 1, ..., М.
Условие Л (к) > 5 определяет величину обнаруживаемого скачка анализируемой функции ^ = = Цю _ Цц, по сути дела — пороговую чувствительность детектора скачков — устройства или программно-аппаратных средств, анализирующих функцию /(х) по ее дискретным отсчетам /1, ., /М- На выбор величины порога 5 оказывают влияние, с одной стороны, допустимый уровень ложных тревог (значимости решений) при обнаружении скачков, с другой стороны, требуемое или ожидаемое количество скачков (существенных изменений) функции /(х) на интервале анализа.
Пример, демонстрирующий принцип обнаружения ярко выраженного скачка анализируемой случайной функции /(х), приведен на рис. 1. При отсутствии увеличения среднего значения функции /т до скачка логарифм отношения правдоподобия имеет тенденцию убывания (его среднее значение убывает по прямой с тангенсом угла наклона -V/ / </ (рис. 1, а). После скачка среднего значения функции /т логарифм отношения правдоподобия имеет тенденцию возрастания (его среднее значение возрастает по прямой с тангенсом угла наклона v2 / / (рис. 1, б). Таким же образом в среднем возрастает и решающая статистика gk, которая до момента скачка была близка к нулю (рис. 1, в).
В условиях априорной неопределенности, когда величина обнаруживаемого скачка V/ неизвестна, она является неизвестным параметром функции правдоподобия Л(к, V/) и также подлежит оцениванию по критерию максимального правдоподобия. При известной координате точки скачка хк (фиксированном к) оценка максимального правдоподобия величины скачка имеет вид
м
V ;
т — т; о —~Ь
т=*
1 М Е(т — т; 0\
М — * + 1
(4)
т=*
а) /
б) Л(Щ
■ Рис. 1. Пример реализации функции /(х) (а), поведения соответствующего ей логарифма функции правдоподобия Л(к) (б) и решающей статистики
При оценивании среднего / используется модель анализируемого процесса В0, а наличие явного решения для 'Vf вида (4) может быть присуще любой линейной модели анализируемого процесса В1. Однако если координата точки скачка неизвестна, то оценивание координаты скачка и его величины в каждой возможной координате составляет задачу двухпараметрической максимизации отношения правдоподобия [2].
С учетом выражения (4) оценка максимального правдоподобия номера координаты, в которой выполняется гипотеза Н1, определяется выражением
.... 12
к = агешах-------------
к 2(М - к + 1)
М
Е(т —о)
т=*
(5)
Соответствующее правило принятия оптимального решения при оценке координаты скачка * имеет вид
Л
ё* = Л(*,\>; ) =
= шах-
* 2(М — * + 1)
М
Е (т — т;о)
т=*
2 Ні
>
<
Но
8.
(6)
Выражения (5) и (6) определяют процедуру оптимального обнаружения момента и величины разладки анализируемой функции /(і), задаваемой составляющими /т, т = і, ..., М. Реализуемый при этом алгоритм вычислений называется алгоритмом кумулятивных сумм. В работах [і, 2] показано, что данный алгоритм является оптимальным последовательным алгоритмом, который при фиксированной вероятности ошибки первого рода а минимизирует среднее число измерений, производимых от начала разладки до ее обнаружения. Получаемая при этом оценка * совпадает с моментом последнего отрыва от нуля статистики gk, алгоритм кумулятивных сумм (6) также называют алгоритмом кумулятивных сумм с отражающим от нуля экраном [3].
Модифицированный алгоритм вычисления кумулятивных сумм с настраиваемым скользящим окном
На практике при решении прикладных задач обнаружения разладки необходимо обнаруживать не единственный скачок функции /(х), а несколько скачков. Для поиска нескольких скачков необходимо выполнить процедуру поиска первого скачка функции /;(х), описываемую выражениями (5) и (6), для каждого значения хт, т = і, ..., М. При принятии решения о наличии скачка функции /т в момент хк это значение фиксируется. Далее процедура оценки координаты скачка повторяется для значений хт, т = к + і, ..., М до обнаружения следующего скачка и так далее до тех пор, пока не будут оценены все М значений функции /;(х). Количество обнаруживаемых скачков Мі ограничивается величиной порога 8.
Как показала практика использования алгоритма кумулятивных сумм (6) при последовательном поиске нескольких скачков, анализ функции /(х) по всей выборке т = і, ..., М не всегда позволяет обнаружить необходимые скачки. Это является следствием распространения алгоритма обнаружения одиночной разладки на задачу обнаружения многократной разладки и связано с тем, что решение о наличии разладки (скачка) анализируемой функции /і(х) принимается в результате сравнения разницы ее среднего значения / на интервале т = і, ..., к и среднего значения / на интервале т = к + і, ..., М. При этом на первом интервале (т = і, ..., к) до момента обнаружения разладки в силу выполнения гипотезы Но других
разладок нет, а на втором интервале (т = к + 1,
М) после момента обнаружения разладки, соответствующей выполнению гипотезы Н1, могут иметь место и другие разладки. Если в моменты этих разладок на втором интервале имеют место скачкообразные изменения функции /(х) и в положительную, и отрицательную сторону, то эти изменения дают противоположный по знаку вклад в величину решающей статистики gk, что затрудняет их обнаружение.
Для устранения этого эффекта предлагается использовать подход к обнаружению последовательности скачков анализируемой функции /(х), основанный на ограничении интервала анализа дискретных отсчетов /1, •", /М- Многократная проверка с использованием критерия максимума логарифма отношения правдоподобия гипотезы Н0 при альтернативе Н1 осуществляется по ограниченной вспомогательной выборке /к + 1, ..., /к + п, выделенной с помощью скользящего окна, из исходной совокупности составляющих /т, т = 1, ., М. Число элементов п во вспомогательной выборке, определяемое размером окна, выбирается таким образом, чтобы кумулятивная сумма формировалась из составляющих анализируемой функции, не содержащих противоположных скачков. Для выборки /к + 1, ., /к + п вычисляется решающая статистика gk++1^ и сравнивается с порогом 5. При gkkt7^ > 5 выдается сигнал о наличии скачка,
а при ^^+1 < 5 рассматривается следующее значение /к + п + 1 и обрабатывается следующая вспомогательная выборка /к + 2, ..., /к + п + 1В результате имеем следующее правило принятия оптимального решения при оценке координаты скачка к:
<.*+П
ё*+1 = тах— * СТ;
*+п
т=*+1
Н
V ; >
2 <
Но
8. (7)
Алгоритм, определяемый выражением (7), представляет собой модифицированный алгоритм вычисления кумулятивных сумм со скользящим окном. При его использовании необходимо выбрать размер вспомогательной выборки (окна) п, соответствующий интервалу корреляции анализируемой функции /(х). Этот интервал корреляции характеризует поле рассеяния пар значений функции /т, /т + і, где і — интервал между отсчетами, выраженный в числе точек, и оценивается по выборочной автоковариационной функции сх(1) анализируемой функции /(х).
Важным свойством автоковариационной функции является способность находить по ним характерные и повторяющиеся участки анализиру-
емого процесса (сигнала) [6]. В рассматриваемом случае анализ автоковариационной функции позволяет обнаруживать масштаб изменений анализируемой функции, соответствующий участкам изменения, которые дают противоположный по знаку вклад в величину решающей статистики gk и могут быть не обнаружены. Объем вспомогательной выборки п можно определить по интервалу корреляции хкор анализируемой функции /(х), соответствующему ширине центрального пика выборочного коэффициента автоковариации гх(1) от максимума до первого пересечения с линией, взятой на некотором уровне, например на уровне гх = 0,5. В последующем полагается, что п = хКОр0,5/Дх, где хКОро,5 — интервал корреляции спектрального образа, определяемый по уровню гх = 0,5; Дх — расстояние между отсчетами /1, •", функции /(х).
Выборочный коэффициент автоковариации определяется выражением
Мс, (0)
(М — I)
1 М
Гт+1 — (М—1) Е/т
т=1
М
(8)
где I = 1, 2, 3, ..., L; сх(0) — автоковариация при I = 0 (дисперсия выборки). Отметим принципиальное значение использования именно автокова-риационной, а не автокорреляционной функции при определении интервала корреляции анализируемой функции /(х), которая в общем случае имеет ненулевое среднее значение — постоянную составляющую. Наличие этой постоянной составляющей приводит к тому, что для стационарного ряда значений анализируемой функции автокорреляционная функция с увеличением х принимает положительные значения и демонстрирует свойство монотонного убывания по абсолютной величине. В результате масштаб автокорреляционной функции выбирается в соответствии с интервалом определения анализируемой функции, а влияние на автокорреляционную функцию изменений анализируемой функции в пределах этого интервала оказывается незначительным. В то же время масштаб автоковариационной функции, которая вычисляется без учета постоянной составляющей анализируемой функции, определяется, прежде всего, масштабом ее изменений на интервале анализа, что позволяет выделить интервал корреляционной связи между отсчетами.
При вычислении значений гх(1) в соответствии с выражением (8) вычитание постоянной состав-
1 М
ляющей --------Е f осуществляется для каж-
(М—*) т=1т
дого из слагаемых внешней суммы по т. Поэтому выборочный коэффициент автоковариации гх(1) обладает отмеченными свойствами и может быть использован для определения (настройки) размера окна при реализации модифицированного алгоритма кумулятивных сумм с настраиваемым скользящим окном.
Пример применения предложенного модифицированного алгоритма обнаружения разладки при обработке многоспектральных данных
Одной из областей применения предложенного алгоритма обнаружения последовательности скачков анализируемой функции является анализ данных многоспектрального дистанционного зондирования Земли (ДЗЗ). В современных системах ДЗЗ широко используются многоспектральные и гиперспектральные датчики с числом спектральных каналов до нескольких тысяч, а корреляционное распознавание наблюдаемых объектов осуществляется по зарегистрированным спектральным образам [7, 8]. В этих условиях для оперативной обработки и передачи данных ДЗЗ необходимо выбирать так называемые наиболее информативные спектральные каналы, соответствующие областям существенных изменений спектральных образов [7].
Рассмотрим пример работы модифицированного алгоритма вычисления кумулятивных сумм с настраиваемым скользящим окном при обнаружении наиболее информативных спектральных каналов многоспектральной системы ДЗЗ. В данном случае в качестве анализируемой функции /(х) выступает спектральный образ наблюдаемого объекта или подстилающей поверхности /(X), где X — длина волны излучения, в виде дискретных составляющих /1, ..., 1м значений коэффициента спектральной яркости, регистрируемой в И спектральных каналах, каждый со средней длиной волны Хт и спектральным разрешением ДХт, т = 1, ..., М. С точки зрения корреляционного распознавания, выбор наиболее информативных спектральных каналов состоит в определении спектральных составляющих, которые при распознавании дают наибольшую корреляцию зарегистрированного спектрального образа с эталонным. Очевидно, что при корреляционном распознавании по спектральным образам максимальный вклад в величину коэффициента корреляции вносят спектральные составляющие, соответствующие участкам наиболее быстрого изменения анализируемого спектрального образа /(X), на которых функция, описывающая спектральный образ, имеет некоторые локальные особенности и существенные изменения в характере поведения.
В рассматриваемом случае анализируемым процессом является спектральный образ /(X), и задача обнаружения изменения свойств анализируемого процесса переносится в частотную область (координатой изменения процесса является длина волны X). При этом постановка задачи определения участков существенных изменений анализируемых спектральных образов полностью соответствует рассмотренной задаче обнаружения разладки анализируемого процесса, и для нее при принятых допущениях может быть получено строгое решение по критерию максимального правдоподобия.
В общем случае задача обнаружения изменения свойств (разладки) анализируемого процесса включает две последовательно решаемые задачи — установления факта изменения свойств и определения момента (координаты) изменения свойств, если считается (по результатам решения первой задачи), что оно произошло. В случае анализа спектральных образов при многоспектральном ДЗЗ решение двух указанных задач позволяет получить оценки координат Хк или номеров к наиболее информативных спектральных каналов для распознавания по ограниченному объему многоспектральных данных. При этом следует отметить, что выбор для распознавания наиболее информативных спектральных каналов соответствует гипотезе существования существенной размерности спектральных признаков при распознавании объектов в системах ДЗЗ, что следует из физической природы оптического излучения [9]. В частности, установлено, что существенная размерность многоспектральных данных в диапазоне 0,4 г 15,0 мкм, определяемая для явлений отражения и излучения энергии от поверхности Земли, составляет около шести. Близкую оценку спектральной размерности данных наблюдений дают и исследования вероятности распознавания по спектральным признакам техногенных объектов на фоне природной подстилающей поверхности [9].
При определении областей изменения зарегистрированного спектрального образа его составляющие в области анализа 1-^, ^, •••, IМ рассматриваются как последовательность независимых случайных гауссовых величин с параметрами: дисперсией ст| и кусочно-постоянным средним Ц/, которое скачкообразно изменяется при переходе от одной дискретной координаты Хт к другой. Оценки максимального правдоподобия координат к наиболее значимых изменений анализируемого спектрального образа и правила принятия решения (решающая статистика) с использованием алгоритма вычисления кумулятивных сумм спектральных составляющих со скользящим окном определяются выражениями (5) и (7)
соответственно с заменой составляющих /і, ., /М на составляющие дискретного спектрального образа в области анализа Іі, ..., ім, дисперсии ст2 — на стр среднего значения / — на и величины скачка V/ — на VI. Последовательное применение данного алгоритма к выборке значений спектральных составляющих позволяет определить номера наиболее информативных спектральных каналов.
На рис. 2 представлены результаты применения рассмотренного модифицированного алгоритма обнаружения разладки к типовому спектральному образу наблюдаемого объекта, полученному в М = 2оо спектральных каналах в диапазоне длин о,35 г 2,5 мкм. Для этого спектрального образа в соответствии с алгоритмом, определяемым выражениями (5) и (7) и запрограммированным в среде программирования MathLab, был осуществлен выбор наиболее информативных спектральных каналов при различных значениях параметров п и 8. На графиках приведен анализируемый спектральный образ, совмещенный с диаграммами, показывающими выбор областей существенного изменения спектрального образа в группах по іо каналов, соответствующих номерам каналов, приведенным в таблицах под диаграммами для различных значений размера вспомогательной выборки п порога 8. Анализ диаграмм и табличных данных позволяет сравнить результаты выбора наиболее информативных спектральных каналов при различных значениях п и 8 и выявить ряд тенденций.
При использовании вспомогательной выборки с изменяющимися объемом п = М - к и значениями порога 8 = і, ..., о,оі (рис. 2, а) хорошо обнаруживаются только наиболее крупные скачки функции спектрального образа (спектральные каналы 78-82, і37-і39, і69-і7о). При пороге 8 < о,оі дополнительно обнаруживаются менее крупные скачки функции спектрального образа (спектральные каналы і46, і68-і69, і82-і89). Таким образом, алгоритм с таким объемом вспомогательной выборки способен обнаруживать малые скачки функции спектрального образа только для больших номеров спектральных каналов, ближайших к М. Это обусловлено тем, что поиск скачков функции спектрального образа в канале с номером к ведется по результату сравнения среднего значения спектральных составляющих на интервале от предыдущего обнаруженного скачка до канала с номером к и среднего на интервале от к до М. В таком случае при малом значении к некоторые скачки функции спектрального образа не вносят существенного изменения в среднее значение спектральных составляющих интервала от к до М. При прибли-
10 20 30 40 50 60 70 80 90 100 110 120 130 140 150 160 170 180 190т
5 = 1 82 139
5 = 0,5 82 139 183
5 = 0,3 81 139 174
5 = 0,1 79 138 170
5 = 0,05 79 138 170
5 = 0,01 78 81 137 139 169 185
5 = 0,005 78 81 137 139 169 184
5 = 0,001 78 80 137 139 146 168 169 182 189
10 20 30 40 50 60 70 80 90 100 110 120 130 140 150 160 170 180 190 т
51 = 1 83 139
52 = 0,5 80 133 146 175
53 = 0,3 78 91 136 170
© 1 5 36 78 85 124 138 155 170
55 = 0,05 33 68 78 84 104 125 137 142 153 169
56 = 0,01 22 33 53 75 79 82 86 98 119 123 135 138 141 148 156 168 171
57 = 0,005 18 31 48 66 75 78 81 84 88 101 117 123 134 137 139 147 152 161 168 170 180
58 = 0,001 12 22 29 33 45 55 65 74 76 78 80 82 84 86 89 96 103 111 116 122 123 129 134 136 138 139 141 145 148 151 155 159 168 169 171 177
10 20 30 40 50 60 70 80 90 100 110 120 130 140 150 160 170 180 190т
5 = 1 83 139
ю 0, 1 5 83 139 183
со 0, 1 5 82 139 174
0, 1 5 38 82 106 138 170
5 = 0,05 35 81 92 137 169
5 = 0,01 31 81 88 137 139 149 168 186
5 = 0,005 31 57 80 86 103 137 139 149 168 185
5 = 0,001 30 35 54 80 86 101 136 138 148 168 169 182 189
■ Рис. 2. Примеры выбора наиболее информативных спектральных каналов для различных значений параметра 5: а — п = М - ^ б — п = 3; в — п = 20
жении значения k к М интервал вычисления среднего уменьшается, и малые скачки становятся более заметными для алгоритма.
При использовании вспомогательной выборки малого объема, например п = 3, и при малых значениях порога 5 < 0,01 (рис. 2, б) проявляется тенденция к обнаружению большого числа малых скачков. Таким образом, алгоритм становится более чувствительным к многочисленным шумовым составляющим функции спектрального образа, обнаруживая помимо значительных скачков функции спектрального образа все прочие менее значимые скачки.
В двух рассмотренных случаях выбор объема вспомогательной выборки п (размера окна) осуществлялся без учета величины интервала автокорреляции Хкор0 5 автоковариационной функции анализируемого спектрального образа. Как показали исследования функций спектральных образов различных наземных объектов и подстилающей поверхности, для рационального выбора значения п может быть рекомендовано его определение по величине интервала корреляции Хкоро 5, соответствующего ширине центрального пика автоковариационной функции с-к(Г) анализируемой функции /(X). Выборочный коэффициент автоковариации дискретной функции спектрального образа г^(1) определяется выражением вида (8) с заменой составляющих /1 ..., ім на составляющие Іі, ..., 1М. Для рассматриваемого в качестве примера спектрального образа определяемая таким путем величина вспомогательной выборки составляет п = 20.
Таким образом, в общем случае размер вспомогательной выборки п при настройке алгоритма анализа спектрального образа сверху ограничивается условием п < М - k и выбирается исходя из условия Хкоро 5 / АХ < п < Хкор / ДХ. При выборе параметра п результаты работы алгоритма становятся зависимыми только от выбора порога 5. Увеличение порога 5 приводит к уменьшению количества выбираемых наиболее информативных спектральных каналов, а уменьшение 5 — соответственно к увеличению их количества. Подбирая значения порога 5, можно осуществлять управление алгоритмом обработки спектрального образа по параметру Мі — числу выбираемых наиболее информативных спектральных каналов.
При использовании вспомогательной выборки объемом п = 20 и значениях порога 5 = 1, ..., 0,1 (рис. 2, в) алгоритм позволяет обнаруживать только наиболее крупные скачки функции спектрального образа (спектральные каналы на интервалах 38, 81-83, 138-139, 170-174). При значении порога 5 < 0,1 помимо крупных скачков обнаруживаются менее значительные, а крупные скачки представляются обнаружением несколь-
ких скачков в близко расположенных спектральных каналах. Например, при значении порога 5 = 0,1 в анализируемой функции спектрального образа обнаруживается пять скачков с соответствующими номерами спектральных каналов 38, 81, 96, 138, 170. При снижении порога до 5 = 0,005 скачок функции спектрального образа, обнаруживаемый ранее в спектральном канале 38, также обнаруживается, но представлен уже тремя каналами с номерами 21, 33 и 51. Аналогично скачок в спектральном канале 81, обнаруживаемый при 5 = 0,1, при 5 = 0,005 представлен четырьмя каналами с номерами 79, 84, 90 и 105. Аналогичная тенденция наблюдается и в других случаях.
Результаты проведенных исследований, в частности диаграммы, приведенные на рис. 2, свидетельствуют, что с изменением порога происходит изменение чувствительности алгоритма с хорошей повторяемостью выбора наиболее информативных спектральных каналов в областях наиболее существенных изменений анализируемых спектральных образов. На практике при реализации алгоритма выбора наиболее информативных спектральных каналов необходимым условием является выбор для любой функции спектрального образа /(X) одного и того же количества М-1 спектральных каналов. При таком условии для каждой реализации функции /(X) необходим подбор порогового значения 5, обеспечивающего выбор заданного количества М^ областей существенного изменения. Однако вычисление пороговых значений 5, обеспечивающих выбор заданного количества М^ наиболее информативных спектральных каналов, для всего многообразия реализаций функций /(X) и условий многоспектральной съемки является задачей, не имеющей общего решения. Она должна решаться итерационно для заданных /(X) и Мг
Заключение
В работе рассмотрено решение задачи обнаружения координат изменения свойств (разладки) случайного процесса в виде правила принятия решения и оценки максимального правдоподобия координаты скачка анализируемой функции, определяемой с использованием алгоритма вычисления кумулятивных сумм. Для представляющего наибольший практический интерес случая определения последовательности скачков предложен модифицированный алгоритм вычисления кумулятивных сумм со скользящим окном, ограничивающим объем выборки, используемой при расчетах спектральных составляющих. Использование скользящего окна позволяет исключить пропуски скачков, дающих противопо-
ложный по знаку вклад в величину решающей статистики. Основными настраиваемыми параметрами алгоритма являются величина порога и объем вспомогательной выборки, определяющий размер скользящего окна.
Разработанный алгоритм вычисления кумулятивных сумм со скользящим окном программно реализован в виде пакета прикладных программ в среде программирования MathLab и применен для анализа функций спектральных обра-
Литература
1. Жиглявский А. А., Красковский А. Е. Обнаружение разладки случайных процессов в задачах радиотехники. — Л.: Изд-во ЛГУ, 1988. — 224 с.
2. Бассвиль М. и др. Обнаружение изменения свойств сигналов и динамических систем: пер. с англ. — М.: Мир, 1989. — 280 с.
3. Никифоров И. В. Последовательное обнаружение изменения свойств временных рядов. — М.: Наука, 1983. — 200 с.
4. Ширяев А. Н. Статистический последовательный анализ. Оптимальные правила остановки. — М.: Наука, 1976. — 272 с.
5. Ширяев А. Н. Об условно-экстремальных задачах скорейшего обнаружения непредсказуемых моментов у наблюдаемого броуновского движения // Теория вероятностей и ее применения. 2008. Т. 53. Вып. 4. С. 751-768.
зов наземных объектов и подстилающей поверхности в целях выбора наиболее информативных спектральных каналов многоспектральных систем ДЗЗ. Анализ полученных результатов демонстрирует работоспособность алгоритма и возможности его настройки с хорошей повторяемостью выбора наиболее информативных спектральных каналов в областях наиболее существенных изменений анализируемых типовых спектральных образов.
6. Репин В. Г., Тартаковский Г. П. Статистический синтез при априорной неопределенности и адаптация информационных систем. — М.: Сов. радио, 1977. — 432 с.
7. Мальцев Г. Н., Козинов И. А., Фатеев В. Ф. Методы выбора наиболее информативных спектральных каналов при дистанционном зондировании Земли с малых КА // Изв. вузов. Приборостроение. 2007. № 6. С. 23-31.
8. Мальцев Г. Н., Козинов И. А., Данилкин А. П. Космические системы и технологии многоспектрального дистанционного зондирования Земли // Информация и космос. 2010. № 1. С. 148-158.
9. Дейвис Ш. М. и др. Дистанционное зондирование: количественный подход: пер. с англ. — М.: Недра, 1983. — 415 с.