УДК 004.5; 004.8; 007.85 А.Я. КУЗЕМИН
ОБОБЩЕННАЯ МОДЕЛЬ И ПРОГНОЗИРОВАНИЕ ЧРЕЗВЫЧАЙНЫХ ПРИРОДНЫХ СИТУАЦИЙ
Рассматриваются процессы и явления, которые приводят к чрезвычайным природным ситуациям, их анализ и ситуационное моделирование и прогнозирование чрезвычайных ситуаций для их мониторинга, предупреждения и ликвидации последствий.
Актуальность. Под чрезвычайными природными ситуациями (ЧПС) будем понимать нарушение устойчивого состояния объектов окружающей природной среды, которое под воздействием метеорологических и других внешних факторов приобретает катастрофическое развитие или непрекращающийся рост (превышение скорости изменения состояния выше допустимого значения), что приводит к экономическим, социальным и людским потерям.
В настоящее время для жизнедеятельности человека в природной сфере постоянно возникают опасности и угрозы, так называемые ЧПС. Результатом ЧПС является вред, который наносится природе, человеку, объектам экономики, социальной сфере, окружающей природной среде. В этой связи актуальным является мониторинг и прогнозирование ЧПС - наблюдение, контроль и предвидение опасных процессов и явлений природы, являющихся источниками чрезвычайных ситуаций, а также динамики развития чрезвычайных ситуаций, определения их масштабов в целях решения задач предупреждения и организации ликвидации последствий бедствий.
Объектом исследования являются методология, методы, модели, информационная технология создания подсистемы сбора, передачи и обработки информации специализированной информационно-аналитической системы (СИАС).
Предметом исследования является разработка методов и информационных технологий моделирования и прогнозирования чрезвычайных природных ситуаций для мониторинга, предупреждения и ликвидации их последствий.
Задача - необходимо разработать модель прогнозирования чрезвычайных природных ситуаций, которая даст возможность повысить достоверность и надежность количественных данных анализа ситуаций и обеспечить эффективность прогнозирования в чрезвычайных природных ситуациях.
Решение проблемы. Задачи контроля и прогнозирования природной среды {Zps} для разработки комплексов информационно-аналитической системы (ИАС) определяются функциональным комплексом и соответствуют требованиям к структуре ИАС {Str} в целом. Оптимальные процедуры разработки ИАС {Pr} (в смысле удовлетворения соответствующим показателям качества {Pk}) должны привести к реализации наиболее эффективной структуры обеспечивающего комплекса ИАС {Str} . При этом комплектующие элементы и подсистемы Str^ (i = 1,K) обеспечивающего комплекса ИАС должны наилучшим образом реализовывать требования и характеристики статистической модели ЧПС {Mod}, методов разработки {Met} , алгоритмов поиска решений {Alg} как для проектирования ИАС, так и анализа ситуации и обеспечивать принятие наилучших решений в ЧПС. В этом случае справедливо для решения Z задач {Zps} разработку структуры ИАС {Str} представить в следующем виде:
{Met, Alg, Prog,Mod, Zps, Pk} {Pr} >{Str}, {Str e Str}, i = 1,K
Pke = extr extr extr extr extr Pk(Mete,Alge ,Proge ,Mode,ZPse),
MeteeMet Algee AlgProgp eProgModeeModZpseZps
где Mete - e — й метод разрабоотки ИАС, e = 1, E ; Alge - j - й алгоритм алгоритмического, обеспечивающего комплекса ИАС для e — го метода разработки ИАС, j = 1,J; среди методов и алгоритмов можно выделить: методы максимального правдоподобия, минимизации байесовского риска и группового учета аргументов, обычный и взвешенный метод наименьшей квадратичной ошибки (МНК), гребневые, робастные и рекуррентные процедуры, нейронные сети, генетические алгоритмы, адаптивные и другие процедуры; Prog( -р — я программа программного обеспечивающего комплекса ИАС для реализации j — го алгоритма в e — м методе разработки ИАС, р = 1, П ; Mode -1 — я модель природной среды в
e — м методе разработки ИАС, t = 1,T ; Zad^ - П — я задача контроля и прогнозирования
— e
природной среды для e — го метода разработки ИАС, n = 1,Z; Pk - показатель качества обеспечивающего комплекса ИАС для e — го метода разработки ИАС.
Рассмотрим процесс создания статистической модели ЧПС {Mod} с позиций системного анализа [1, 2]. При разработке статистической модели {Mod} необходимо выбрать наиболее эффективные варианты моделирования, которые обеспечивают получение заданных достоверных оценок ЧПС при минимуме затрат средств и времени.
{Mod} представления ЧПС должна отражать связь природных ситуаций с поиском управленческих, организационных решений 3 [3], направленных на предотвращение или ликвидацию последствий чрезвычайных ситуаций, которые обеспечат минимум риска для жизнедеятельности человека Re [3] и потребуют необходимые ресурсы £ [2]; накопленными статистическими характеристиками природной среды в условиях чрезвычайных ситуаций {X}; возможностью получить прогноз ЧПС как можно с большим запасом времени для своевременной и эффективной реакции на ЧПС. Другими словами, для решения поставленной выше проблемы для i -й ситуации природной среды в заданном, контролируемом районе необходимо разработать модель ЧПС в следующем виде:
Modi = extr Mod{Xi,Ei,}, (1)
re eRe
где i = 1, N - число возможных ситуаций природной среды.
Интеграция в одной модели (1) указанных элементов может быть, если учесть следующие закономерности: А — ассоциации; п — последовательности; к — классификации; KL — кластеризации; pr — прогнозирования.
Ассоциация имеет место в том случае, если текущая, проблемная природная ситуация et, где t — текущее время, и предшествующая или раннее происходившая ситуация Si
были связаны друг с другом. Имеется связь А : et ^ S: .
t—1 t
Для П справедливо П : S- ^ S- , так как существует цепочка связанных во времени ситуаций.
С помощью классификации Si = K{(Si e K^) v (Si e K_kr)}, где K^ — класс чрезвычайных ситуаций, а K _kr — класс не чрезвычайных ситуаций, выявляются признаки через
введенные микроситуации [1,2,4], характеризующие группу ситуаций, к которой принадлежит та или иная ситуация [2,3]. Это делается посредством анализа уже классифицированных ситуаций и формулирования некоторого набора правил [3,4].
Кластеризация Si = KL{(Si е KL^) v (Si e KL—отличается от классификации тем,
что сами группы заранее не заданы. С помощью кластеризации средства Data Mining самостоятельно выделяют различные, однородные группы данных [4].
В предлагаемой технологии моделирования и прогнозирования ЧПС (рисунок) прежде всего рассмотрим особенности системного анализа априорных данных о природных ситуациях, которые приводили к чрезвычайным ситуациям. Не теряя общности, предлагаемую технологию можно рассмотреть на примере такого природного явления как сход лавин в горной местности.
Технология моделирования и прогнозирования природной ситуации
Практически статистическая обработка данных для любых природных ситуаций начинается с графического анализа данных [2], предварительного системного анализа статистических данных о ЧПС различными методами. Предлагается использовать наилучшие стороны следующих методов [1,2,6]: регрессионного анализа, дисперсионного многофакторного анализа, построения деревьев решений (decision trees), Data Mining, метода группового учета главных аргументов (МГУА), метода распознавания образов, метода с использованием нечетких множеств.
Повысить достоверность анализа и прогноза схода лавин помогает и представление многообразия факторов их возникновения в виде множества микроситауций [1-3]. Каждая такая микроситуация соответствует определенной комбинации факторов, которые характеризуют среду возникновения чрезвычайной ситуации. В то же время такое представление позволяет разбить все множество причин, влияющих на возникновение лавины, на два подкласса ситуаций. В случае анализа лавинного климата [1-4] были выделены два класса лавиноопасных и нелавиноопасных ситуаций:
" Лавиноопасно" = ({F^ (Х)}/{fn (x)}) u a ({F^ (x)}/{FN (X)}) u ({F^ (x)}/{fl (X)}u) u ({fjn (x)}/{fn (X)}) u ({fn (x)}/{fjn (X)}) u ({fjn (x)}/{fn (X)}) , " Нелавиноопасно" = ({fjj (x)}/^ (X)}) u ({fll (x)} п {FJ (x)}) u u ({fln (x )} п {fjl (x )}) u ({fjj (x )}/{fll (X)}),
где fl (X) (FjN(X)), F]J(X)(F]N (X)) - функции вероятности отнесения лавиноопасной (нелавиноопасной) микроситуации к лавиноопасному (нелавиноопасному) классу соответственно на множестве факторов среды возникновения лавинной опасности X [3].
При этом проведение предварительного статистического анализа предупреждения возникновения лавиноопасных ситуаций позволяет определить дискриминантные функции прогноза таких ситуаций. Полученные с помощью таких функций результаты оценивания вероятности отнесения исследуемых данных к классам, которые описывают либо лавиноопасные, либо нелавиноопасные ситуации схода лавин, дают вероятностную оценку наступления чрезвычайной ситуации, в данном случае - лавины.
В то же время преставление факторов лавинной опасности в виде классов микроситуаций позволило получить объективное соответствие между вероятностными оценками схода лавин и степенями шкалы лавинной опасности, что, в конечном счете, позволяет проводить сравнительную оценку времени до наступления чрезвычайной ситуации. Сущность такой оценки заключается в построении и анализе на основе теории нечетких множеств [2-4].
В целом сущность такого описания сводится к построению нечеткой модели оценки временных характеристик лавиноопасных ситуаций. Так, можно предположить, что в случае анализа нелавиноопасных ситуаций время до предполагаемого схода лавины будет тем больше, чем больше вероятность отнесения текущих параметров анализа среды возникновения лавинного климата к такой ситуации. Соответственно отнесение текущих параметров анализа среды возникновения лавинного климата к такой ситуации может свидетельствовать о незначительном запасе времени до момента наступления схода лавины [1,2].
В результате проведенных исследований по результатам предварительного анализа априорных данных строится ситуационная модель природной среды для j-й ситуации и i-го
параметра природной среды: Modj =f (xj,f ,x2,f ,...xj,f ,...xM,f), где j=1,M-количество микроситуаций; i = 1, N — количество параметров; {xi}-множество параметров природной
среды, при условии П W• -Ж . Для природной среды в контролируемый момент времени t 1
имеем обобщенную ситуационную модель при L е М (не для всех моделей число микроситуаций одинаково):
Л^
( М| М| М1 М1 ^ Х1,1 'х2,1 ,'Х1,1 ,'ХШ
Sit' -f .ъС
( М; М' М' М'^
у 2 у 2 У 2 У 2
х1,2 ,х2,2 '"''1,2 '•••'XN,2
( М' М' М^ М' ^ Х1,с1 'Х2,с1 ' 'Х14 ''Х^С
V /
М' М' М' М'
SitM't-f I Х1 'tF 'X2'tF' 'Xi'tF ''• 'XNД
На основании предварительного анализа априорной информации о природных ситуациях (выборки) может быть решена задача прогнозирования (продолжения) многомерного временного ряда (случайного процесса с дискретным временем)' а также экспертной информации' представленной набором несогласованных вероятностных высказываний нескольких экспертов [5]. Имеем набор Х1'Х2' ''Х1' ''Х^' который составляет временной ряд и' как уже отмечалось на примере снежных лавин' предполагается разнотипный' т.е. переменные могут быть непрерывными и дискретными' с упорядоченным и неупорядоченным множеством значений. Несогласованность экспертной информации предполагает' что высказывания могут быть в той или иной степени противоречивыми.
Для прогнозирования временного ряда может быть построена решающая функция' которая будет отражать вероятностные свойства изучаемого случайного процесса и представлять собой оценку условного распределения в пространстве переменных прогнозируемого момента времени при заданной предыстории.
Пусть Х-{Х1'Х2 '''''X .'''''Хп} - разнотипный набор данных природной ситуации; D.-1 2 J •
множество допустимых значений переменной X. (все D. предполагаются ограниченны-
п • „ •
ми); D= П D • - пространство значений' а х-^ '''''Xn)ID - кортеж значений переменных.
1-1 • __
Пусть зафиксировано N+1 отсчетов времени ^'N+1. Задача прогнозирования временного
ряда состоит в том' чтобы по известным значениям переменных для N отсчетов (предыстории) оценить значения переменных для N+1 - прогнозируемого момента времени. Индексы' соответствующие отсчетам времени' будем размещать слева. Таким образом' I х будет обозначать кортеж значений переменных для момента времени /. Для
удобства записи предыстории введем также обозначения 1'ГР1 и ^т Се^ -
„ „ т-, Е ^ -Ч-1х''"'ЬтХ)
составной кортеж значений переменных для предыстории. При этом 1'тх^т-1+1' где Dk -
к-я степень пространства D . Тогда DN+1 будет пространством реализаций исследуемого
случайного процесса.
Сформулируем задачу построения решающей функции. Для этого рассмотрим статистическую игру (С'С 'Д'У^' где С- множество стратегий природы' С - множество решений (в нашем случае С ГСХ Д(С'С)- функция потерь' V- пространство наблюдений.
Со стратегией природы с1С свяжем tPc(D/1'rx)- условное распределение в пространстве переменных для отсчета t при известных значениях переменных для отсчетов НД-1'Г'
где г=г(^с) - длина существенной предыстории (влияющей на распределение для данного отсчета).
Будем предполагать, что вероятностные свойства процесса со временем не меняются, П Т~г
т.е. t Рс (О''t х)=Рс (О/ ' х) - условное распределение не зависит о^ .
Задачу прогнозирования временного ряда можно решать через восстановление стратегии С . При этом требуется указать алгоритм Q : V ^ С , который по полученной эмпирической информации V е V строит О^/'Л 6 о - оценку стратегии природы. В эмпирических данных могут одновременно присутствовать как реализация предыстории процесса, так и
вероятностные высказывания экспертов, т. е. где —^х, а V2 = {В■ е В | i = Т,М} . Здесь В - множество всевозможных высказываний вида В^=аТ,гЕ^,{(0Е^,к,р^,к)|к=Т,К^},у^, где
1Г / г п / л 1,к 0тЛ,к , Т,г ч А
'' Е е О , 0е ' е о, Р = Р( х е Е / х) - оценка вероятности попадания в 0^/,л
при любом Т,г х е Т,гЕ ; У/ - оценка степени доверия высказыванию.
Для пояснения обозначений приведем пример возможного экспертного высказывания для контролируемого лавиноопасного района:
"ЕСЛИ средний уровень снега за прошлый год меньше 1700 см
И суммарные годовые осадки в виде снега за прошлый год больше 800 см
ИЛИ средний уровень снега за прошлый год меньше 1650 см
И средний уровень снега за позапрошлый год больше 1800,
ТО средний уровень снега в текущем году прогнозируется
от 1500 см до 1700 см с вероятностью 0,4,
от 1700 см до 2000 см с вероятностью 0,3,
свыше 2000 см с вероятностью 0,2,
менее 1500 см с вероятностью 0,1;
уверенность 0,8".
Обозначив Х1 = "средний уровень снега", Х2 = " суммарные годовые осадки в виде снега ", можем записать данное высказывание в виде:
<(Е х Е) х 20и (:Е2 х 02) х (2Е\ х 202),{(0Е1 х 0О2,0,1), (°Е2 х °02,0,4),(0Е3 х °02,0,3),(0е4 х °£>2,0,2)}, 0,8).
Здесь =[а: ,1700[, 1 Е* =]800,в2], ^ 2 =[а1,Т670[, 2е| =]Т800,p 0е1=[а1 ,Т500[, 0Е2 =[1500,1700], 0ез=[1700,2000], 0е4=]2000,р1 ],
где аj и вj - соответственно минимальное и максимальное значения переменной X^ . При
этом р1 =0,1, р2=0,4, р3 =0,3, р4=0,2, у=0,8 . Несмотря на то, что все /о совпадают с о , мы для наглядности поставили индексы, соответствующие номеру отсчета предыстории.
Построение решающих функций. Предлагаемый метод [5] решения задачи прогнозирования состоит в получении апостериорной (при заданной эмпирической информации, которой иногда либо нет, либо сбор ее еще не организован, поэтому использовать данный
метод прогноза не всегда удается) вероятностной меры на стратегиях природы с использованием формулы Байеса:
P( V = (1 gc (v)dP(C))-1 (V)P(C), /V c
где gc (V) - функция правдоподобия для эмпирической информации (определение которой
требует дополнительных затрат на проведение исследований), Р(С) - априорное распределение на классе стратегий природы.
Для коррекции прогноза ЧПС по методу МГУА [4,6] определяется математическое описание природной ситуации как функционального преобразования типа «вход-выход»
следующего вида: ^ ^хООХ где ^ - выходное значение природной ситуации (сход лавины, возникновения селя, оползня в конечном итоге характеризуется во времени перемещением по склону горы быстро увеличивающейся массы снега, породы и т.п. с нарастающей
скоростью и объемом); ^ - входной вектор изменяемых во времени параметров (метеорологическое влияние) с ограниченным объемом выборки; ^ -< tN - диапазон изменения времени для контролируемой ситуации.
Для определения меры совпадения выхода модели WtMod и наблюдаемого выхода ^
служит критерий качества Q(Wt,wtMod), которым является результат анализа прогноза:
г г - ай - прогноз подтвердился , | г > а й - прогноз не подтвердился
где г - мера близости действительной и модельной ситуации; Аd0p - максимально допустимое значение близости.
Используя ряд Вольтера для динамической системы, можно получить его дискретный аналог в виде полинома Колмогорова-Габора:
п и,
МоН 1 2 3
WtMoa=aп+ 2 а.х. + 2 2 х.А..х.^,
t 0 i=0 i it i=0 j=0 " У jt
где xit =и(^0, ао - коэффициенты качества и матрицы уравнения Wt 0 , которые соответствуют оптимальному значению и определяются по наблюдениям При
п1=п2=пз=0 имеем частный случай уравнения WtMod для стационарного режима.
Для получения оценки долгосрочного и краткосрочного прогноза должны быть накоплены статистические данные величины V, которые влияют на величину прогнозируемого параметра ю или коррелированы с ним. В результате наблюдений параметров природной ситуации можно получить выборку с ограниченным объемом реализаций ю, vt, t6 N . На интервале прогнозирования тб P, где р- критерий качества прогноза, исследуется изменение величины . Прогноз изменения выходного параметра (нарастающего смещения снега, грунта, селя и т.п.) можно определить на прогнозной модели типа:
Ю+т ,®М,.",^-к,Vt.
Оценкой меры совпадения модели и контролируемого выхода ю+т может слу-
жить критерий качества Q(Юt+т,wM0d). По наблюдениям Ю;, , 16 N и матрицы коэффициентов в переходим к прогнозированию значения выходного параметра, для этого
обозначим Wt ®t+r'xit
Ч-i
v vt-i y
. При этом для краткосрочного прогноза P < 3, а для долго-
срочного P < 10 .
Выводы. В работе изложена общая концепция построения моделей и процедур прогнозирования возникновения ЧПС на основе вероятностных и нечетко-множественных подходов к ее интерпретации. Такое представление позволяет, прежде всего, учесть диапазон изменения факторов влияния на возникновение лавиноопасных ситуаций, построить адекватные процедуры их предсказания. Основой для предлагаемых выше подходов для прогнозирования ЧПС служит априорная, историческая информация, которая не всегда находится в распоряжении исследователей. Поэтому наиболее приемлемым в настоящее время является описанный выше подход сравнительной оценки прогноза ЧПС, как сравнения события на основе анализа микроситуаций [4]. Предложена обобщенная математическая модель прогнозирования чрезвычайных природных ситуаций, которая, в отличие от существующих, использует представление ситуаций на базе множеств микроситуаций, которые дали возможность повысить достоверность и надежность количественных данных анализа ситуаций и обеспечить эффективность их прогнозирования в чрезвычайных природных ситуациях.
Список литературы: 1. Kuzemin A, Fastova D, Yanchevsky I. Methods of adaptive extraction and analysis of knowledge for knowledge-base construction and fast décision making // International Journal on Information Theories&Applicatios. Bulgaria. 2005. Vol. 12, №>1. P. 93-99. 2. КуземинА.Я., Фастова Д.В., Дяченко О.Н. Геоинформационная система для классификации и прогнозирования лавинной опасности // АСУ и приборы автоматики. 2006. Вип. 136. С. 87-91. 3. Куземин А.Я., Левыкин В.М. Разработка инструментальных средств обеспечения принятия решений для предупреждения и управления в чрезвычайных природных ситуациях // Автоматизированные системы управления и приборы автоматики. 2007. .№139. С. 31- 38. 4.КуземинА.Я., ФастоваД.В., Дяченко О.Н. Моделирование процесса образования лавин // Реестращя, збертання i обробка даних. К.: ИПРИ НАН Украины, 2006. Т.8, J№4. С.22-30. 5. Лбов Г. С., Неделько В. М. Байесовский подход к решению задачи прогнозирования на основе информации экспертов и таблицы данных. // Доклады РАН. 1997. Т. 357. .№ 1. С. 29-32. 6. Ивахненко А.Г., Мюллер Й.А. Самоорганизация прогнозирующих моделей. К.: Техшка, 1985; Берлин: ФЕБ Ферлаг Техник, 1984. 223 с.
Поступила в редколлегию 12.11.2007 Куземин Александр Яковлевич, канд. техн. наук, проф. кафедры информатики ХНУРЭ. Научные интересы: системный анализ, оптимизация, управление рисками, создание ситуационных центров. Адрес: Украина, 61166, Харьков, пр. Ленина, 14, тел. 702-15-15.