УДК 330.45
08.00.00 Экономические науки
МЕТОДЫ ВЕЙВЛЕТ-АНАЛИЗА КАК ИНСТРУМЕНТ УПРАВЛЕНИЯ ЭКОНОМИЧЕСКОЙ БЕЗОПАСНОСТЬЮ
Кумратова Альфира Менлигуловна к.э.н., доцент БР1Ы-код=2144-8802
Сайкинов Виктор Евгеньевич аспирант
БРШ-код=2639-9113
Егоян Алиса Валерьевна магистрант
Татевосян Сергей Олегович магистрант БРШ-код=2957-8144
ФГБОУВПО «Кубанский государственный аграрный университет» г. Краснодар, Россия
В условиях объективного существования риска и связанных с ним экономических, человеческих и др. потерь возникает потребность в определенном механизме, который позволил бы наилучшим образом спрогнозировать ущерб от чрезвычайной ситуации. Такими механизмами управление риском при чрезвычайных ситуациях являются мониторинг и прогнозирование. В данной исследовательской работе в качестве исследуемого сигнала использован временной ряд, содержащий в себе информацию о количестве пожаров по Карачаево-Черкесии за период с 1983-2014 гг. При решении задачи авторами применены инструменты вейвлетов по очистке данных от шумов, аномалий, которые обеспечили качество построения модели достоверного прогноза - возможного количества пожаров на один квартал вперед. Данный пример показал, что для построения этого прогноза нет необходимости в строгой математической спецификации модели, что особенно ценно при анализе слабоформализуемых процессов. Большинство задач в сфере чрезвычайных ситуаций относятся именно к этой категории процессов
Ключевые слова: ВРЕМЕННОЙ РЯД, ВЕЙВЛЕТ-АНАЛИЗ, ОЧИСТКА ДАННЫХ, КОЛИЧЕСТВО ПОЖАРОВ, СГЛАЖИВАНИЕ, ПРОГНОЗ, ПРЕДПРОГНОЗНЫЙ АНАЛИЗ, ВЫБРОС
UDC 330.47 Economic science
METHODS OF WAVELET ANALYSIS AS A TOOL OF ECONOMIC SECURITY
Kumratova Alfira Menligulovna
Cand. Econ. Sci., Assistant professor, SPIN-
codе=2144-8802
Saikinov Viktor Evgenyevich postgraduate student SPIN-codе=2144-8802
Egoyan Alisa Valeryevna Master of Science
Tatevosyan Sergey Olegovich
Master of Science, SPIN-ro^ÇS?^^
Federal state budget institution of higher professional
education "Kuban state agrarian University",
Krasnodar, Russia
In the context of the objective existence of risk and economic, human and other losses related with it, there is a need in a specific mechanism, which would allow the best way to predict the damage caused by the emergency. These risk management tools in emergency situations are monitoring and forecasting. In this research work, time series are used as a signal; they contain information about the number of fires in the Karachayevo-Cherkessia in the period of 19832014. In solving the problem, the authors applied wavelet tools for data cleaning from noise, anomalies that have provided quality model building reliable forecast - possible number of fires in one quarter ahead. This example shows that for the construction of this forecast there is no need for a rigorous mathematical model specification, which is especially valuable in the analysis of poorly formalized processes. We have noted that most of the tasks in emergencies fall into this category of processes
Keywords: TIME SERIES, WAVELET ANALYSIS, DATA CLEANING, NUMBER OF FIRES, BNR, FORECAST, FORECASTING ANALYSIS, RELEASE
Работа выполнена при финансовой поддержке РФФИ (проект № 16-06-00158 А)
Во всем мире, в том числе и в России в последнее время наблюдается тенденция увеличения числа возникающих чрезвычайных ситуаций природного и экологического характера, рост размеров материального ущерба от них. Главными факторами, влияющими на увеличение количества чрезвычайных ситуаций являются: антропогенное воздействие человека на планету, глобальное изменение климата, прогрессирующая урбанизация территорий, увеличение плотности населения Земли.
Одним из распространенных видов чрезвычайных ситуаций в последнее время на территории РФ являются пожары.
Наиболее неблагополучная обстановка с пожарами сложилась в Дагестане, Карачаево-Черкесской Республике (КЧР), Северной Осетии, Мурманской и Читинской областях, где наблюдается синхронное увеличение количества пожаров и жертв, пострадавших от чрезвычайных ситуаций.
В данной исследовательской работе продемонстрированы методы вейвлет-анализа, которые использованы с целью прогнозирования возможного количества возникновения пожаров. Непрерывный вейвлет-анализ, по сравнению с методами нелинейной динамики позволяет лучше локализовать процесс во времени.
Вопрос подготовки данных для предпрогнозного анализа и прогнозирования как социальных, так и экономических процессов является важным этапом, т.к. данные могут содержать различные «шумы», за которыми трудно видеть общую картину. Влияние таких факторов как «шумы» и аномалии на общую модель необходимо минимизировать.
Ж-преобразование сигналов или компактно-волновое (wavelet transform) является не менее общим по областям своих применений, чем классическое преобразование Фурье. Фундаментальный принцип ортогонального разложения по компактным волнам состоит в возможности
независимого анализа функции на разных масштабах ее изменения. W-представление сигналов (функций времени) является промежуточным, между полностью спектральным и полностью временным представлениями.
Опишем вейвлет [1] следующим образом: суть применения вейвлетов для многомасштабного анализа заключается в том, что разложение сигнала производится по базису, образованному сдвигами и разномасштабными копиями функции-прототипа. Это означает, что вейвлет-преобразование обладает фрактальными свойствами. Такие базисные функции называются вейвлетами (wavelet), если они определены на пространстве L (R), колеблются вокруг оси абсцисс и быстро сходятся к нулю по мере увеличения абсолютного значения аргумента (в соответствии с рисунком 1). Таким образом, свертка сигнала с одним из вейвлетов позволяет выделить характерные особенности сигнала в области локализации этого вейвлета, причем, чем больший масштаб имеет вейвлет, тем более широкая область сигнала будет оказывать влияние на результат свертки [10].
Для того, чтобы функция у (г) могла называться вейвлетом, необходимо и достаточно, чтобы выполнялись два условия:
1. интеграл по всей прямой (т.е. ее среднее значение) равен нулю;
2. функция у (г) быстро убывает при г ®±¥.
Подробное описание вейвлет-анализа представлено в работе [10]. Одним из важнейших аналитических показателей как природных, так
Mexicar Hat Wavelet
-4-3-2-10 1 2 3 4
Рисунок 1 - Пример графического изображения популярного вейвлета «Сомбреро» (Mexican hat)
и социальных процессов является периодичность, т.е. повторяемость через определенные промежутки времени. При исследовании временного ряда ежемесячных данных по количеству пожаров в КЧР очевидны сезонные колебания, в январе и июле уровень количества пожаров увеличивается, что влечет за собой снижение количества пожаров (в соответствии с рисунком 2). Наличие актуальной информации о периодических составляющих количества пожаров и глубине их колебаний поможет оптимизировать и спланировать деятельность пожарных частей (распределение сил и средств) на основании данных предыдущих периодов, а также эффективно распределять резервы в течение периода, в зависимости от его фазы (спад, подъем, текущий пик или упадок). Однако комбинация нескольких различных колебаний может иметь настолько сложную форму, что выявить их наличие «на взгляд» не представляется возможным.
Рисунок 2 - Ежемесячные данные по количеству пожаров в Карачаево-Черкесской Республике
Еще одним важным показателем является тренд, т.е. выраженная тенденция движения потоков (устойчивый подъем или спад). Независимо от периодических колебаний тренд показывает динамику развития. Наличие тренда может быть скрытым, неочевидным при визуализации данных. Например, если незначительный тренд «скрыт» сильными колебаниями.
При анализе любой информации немаловажным фактором являются локальные особенности, т.е. резкие, скачкообразные изменения характеристик как природных, так и социальных процессов или явлений.
Локальные особенности имеют хаотический и систематический характер. От случайностей никто не застрахован, но знание закономерности систематических особенностей позволит не только избежать связанных с ними проблем, но даже извлечь из них выгоду.
Любая закономерность, описывающая некоторый процесс, ограничена как по величине, так и во времени (любой процесс имеет начало и конец).
Непрерывное вейвлет-преобразование заключается в вычислении скалярного произведения (величины, показывающей степень «похожести» двух закономерностей) исследуемых данных с различными сдвигами некоторого вейвлета на разных масштабах [3].
Вейвлет можно считать трехмерным спектром, где по оси X отложено время, по оси У - частота, а по оси 1 - амплитуда гармоники с данной частотой в данный момент времени. Обычно на двухмерной плоскости ось 1 отображают в виде градаций черного цвета. При этом черный цвет - максимальная амплитуда, а белый - минимальная. Тогда по черным пятнам заметны самые интересные места.
Фазовые диаграммы непрерывного вейвлет-преобразования временного ряда количества пожаров представлены на рисунке 3. В качестве анализирующего инструмента выбран вейвлет Морле. В данной
диаграмме ось времени расположена по оси X, периоды циклов по оси Y. С помощью программы MatLab 7.0.1 и ее модуля Wavelet Tool Box получены фазовые диаграммы.
i 1 / Ё \ \ 1 ■ Ж 1 1 1 111111\\
t | I 1 / ЛЛ 1шл \
1 if ' я 1 в 1. \ I Г\ 1 иШ\\ \
г / 1 ш ч 1111 [ /
I / _aL ■ ■ Ж и В Ж, ■ ■ I 1 f ВТа^ШЬ 1 ' /м1 (1ТШД1 mi ill /л 'ЖI ШШШшк '
Рисунок 3 - Фазовая диаграмма непрерывного вейвлет-преобразования исследуемого временного ряда количества пожаров X
Изменение структуры картины чрезвычайных ситуаций представляются вертикальными черными кривыми. Чем сильнее ветвится кривая, тем сложнее поведение количества пожаров, так как в эти моменты «играет» множество циклов с маленькими периодами. Поэтому такие моменты (или точки) играют очень важную роль (фактически, каждая особая точка определяется совокупностью точек бифуркации). Чем длиннее черная кривая, тем сложнее поведение временного ряда количества пожаров вокруг кривой. На рисунке 3 четко видна фрактальная структура ряда, те участки наблюдений, где фрактальность нарушается, являются областями нестабильности поведения исследуемого временного ряда.
Рисунок 4 - Структура локальных максимумов - "скелетон" непрерывного вейвлет - преобразования временного ряда количества пожаров X.
Для более детального анализа фазовой диаграммы непрерывного
вейвлет-преобразования временного ряда количества пожаров рассмотрим структуру локальных максимумов (в соответствии с рисунком 4). Скелет максимумов - это, грубо говоря, множество точек на плоскости (x, a), в которых находятся локальные «пики» вейвлет-преобразования. Этих точек обычно очень много в области малых масштабов. Их появлением вейвлет-преобразование реагирует на любые негладкости сигнала. При росте масштаба мелкие негладкости исчезают, а вместе с ними и точки максимумов. Оставшиеся сливаются в довольно гладкие кривые, которые при дальнейшем росте масштаба тоже сливаются друг с другом. При этом они либо «аннигилируют», либо продолжают «расти» в область еще более крупных масштабов.
В определенном смысле, вся существенная информация о сигнале находится в значениях вейвлет-преобразования в точках скелета максимумов. Важные фрактальные параметры временных рядов можно вычислять при помощи значений преобразования только на скелете. Очень полезное свойство скелета - наглядное ранжирование особенностей временного ряда по их «силе».
Для последующего анализа и получения прогнозных значений количества пожаров авторами использован алгоритм дискретного вейвлет-преобразования и нейронные сети.
С целью построения алгоритма дискретного вейвлет-преобразования введем некоторые линейные преобразования. Прежде всего, обозначим для всех l, r е Z сумму чисел по модулю s следующим образом: (l + r)mods, а также положим, что z = (z(0),z(1),...,z(s -1)) есть некоторый вектор, в котором s четно. Тогда вводимые преобразования имеют вид:
Ls z(k) = ^ ht z((l + 2k) mod s) ,
i
Hsz (k) = ^ gi z((l + 2k) mod s)
i
для всех к = 0, — -1. Очевидно, данные выражения являют собой аналоги
высокочастотного и низкочастотного фильтров, с учетом периодического дополнения данных при помощи суммирования по модулю. Ясно, что
преобразования осуществляют разделение исходного вектора длиной " на два вектора половинной длины.
Итак, алгоритм вейвлет-преобразования сводится к реализации итеративной процедуры П - и И -преобразований, применяемых к вектору г = (г(0),¿(1),...,¿(2К -1)). Результатом таких преобразований служат
векторы {г(7, к)|к = 0,21 -1}, {й(7, к)|к = 0,21 -1} коэффициентов аппроксимации
и детализации.
Иначе говоря, рекурсивно данный алгоритм выглядит следующим образом:
а(1, к) = П1+1 а( 1 +1, к) = £ ЬА 7 +1,(/ + 2к) шоё21+1), (1)
1
й (1, к) = И2 (1 +1, к) = £ ^ (1 +1,(1 + 2к) шоё21+1). (2)
1
Вся суть многомасштабного анализа, состоит в том, чтобы взглянуть на сигнал сначала под микроскопом, потом - через лупу, потом отойти на пару шагов, потом посмотреть издалека. Таким образом, в качестве такого входного «укрупненного» сигнала рассмотрен временной ряд ежеквартальных данных по пожарам в Карачаево-Черкесской Республике за период с января 1983 по декабрь 2014 гг. (в соответствии с рисунком 5).
X = (х), I = 1,2,..., N (3)
где N = 128 - количество наблюдений, вошедших в исследуемый временной ряд.
Для ежеквартального временного ряда количества пожаров проведена процедура очистки: восстановлены пропущенные данные, отредактированы аномальные значения, удален шум. Отметим, что в
Deductor Studio данные обрабатываются по частям, такая предобработка данных получила название «парциональная обработка данных».
Следующей процедурой предобработки данных после редактирования аномалий является сглаживание, т.к. после сглаживания данных при помощи вейвлетов динамика изменений определяется и прогнозируется гораздо качественнее.
Для сглаживания временных рядов в Deductor Studio представлены два алгоритма. Первый способ сглаживания - это низко частотная фильтрация с использованием быстрого преобразования Фурье. Второй способ сглаживания - это вейвлет-преобразование. Авторами выбран второй способ, так как он является более универсальным. Для того чтобы сгладить данные исследуемого временного ряда, необходимо задать глубину разложения и порядок вейвлета.
Рисунок 5 - Диаграмма сглаженного временного ряда ежеквартальных данных по количеству пожаров в КЧР (по оси Х представлены даты, по оси У - количество пожаров)
Глубина разложения определяет «масштаб» отсеиваемых деталей: чем больше эта величина, тем более «крупные» детали в исходных данных будут отброшены. При достаточно больших значениях параметра (порядка 7-9) выполняется не только очистка данных от шума, но и их сглаживание («обрезаются» резкие выбросы). Использование слишком больших значений глубины разложения может привести к потере полезной информации из-за слишком большой степени «огрубления» данных. Порядок вейвлета определяет гладкость восстановленного ряда данных: чем меньше значение параметра, тем ярче будут выражены «выбросы», и, наоборот, - при больших значения параметра «выбросы» будут сглажены.
Для временного ряда опытным путем получены следующие параметры вейвлет-анализа: глубина разложения равная двум и порядок равный трем.
Выполненное вейвлет-преобразование (с глубиной разложения равной двум и порядком вейвлета равной трем) позволило из исходного временного ряда исключить несущественные и редко встречающиеся значения, а именно: устранить аномальные выбросы, убрать высокочастотные шумы, исключить интервальные и точечные джокеры.
Благодаря наличию быстрых и эффективных алгоритмов и инструментов реализации, вейвлеты представляются весьма удобным и перспективным механизмом очистки и предварительной обработки данных для использования их в статистических и бизнес-приложениях, системах искусственного интеллекта.
В качестве визуализатора прогнозируемых данных относительно исходных данных, авторами представлена диаграмма рассеивания.
Прогнозирование значения количества пожаров построено на основе данных ежеквартальных изменений этого показателя за последние 30 лет.
Для рассматриваемого случая авторами выбран горизонт прогноза равный единице, то есть получено прогнозное значение количества
пожаров на следующий квартал. В результате получено прогнозное значение на первый квартал 2015 года равное 128. Также авторами получено прогнозное значение на год вперед, равное 478.
Полученный прогноз необходим для оптимального распределения сил и средств при тушении пожаров, что в свою очередь повысит готовность подразделений МЧС к ликвидации чрезвычайных ситуаций.
Н......................................................... """] ! ! -1.................!.....................г................. •Н-----------------!---------------------г----------------- -1-----------------;---------------------!•----------------- ...;.................!.....................1................. Н.................!.....................Ь ............................................................................ ; ] ! 1 ..................г.................1.......................................... ..................1............................!........... . .....1.......... .....Ь.....^..... ^^......!.....
""1.................!.....................1".................
1 ' г ч-----------------;---------------------\----------------- ..._________________;_____________________;____________ ■ 1 Ж ♦ -«•
_________________;_____________________ л
- * ^ ..........
..........
----------
Рисунок 6 - Диаграмма рассеивания прогнозных значений и исходного временного ряда - ежеквартальных данных по количеству пожаров в КЧР
При решении задачи авторами применены инструменты вейвлетов по очистке данных от шумов, аномалий, которые обеспечили качество построения модели прогноза. Получен достоверный результат прогноза возможного количества пожаров на один квартал вперед. Данный пример показал, что для построения прогноза нет необходимости в строгой математической спецификации модели, что особенно ценно при анализе слабоформализуемых процессов. Отметим, что большинство задач в сфере чрезвычайных ситуаций относятся именно к этой категории процессов.
Литература
1. Вощинин А. П. Оптимизация в условиях неопределенности / А. П. Вощинин, Г. Р. Сотиров. - М.: Финансы и статистика, 1989. - 400 с.
2. Камаев В. Д. Экономика и бизнес / В. Д. Камаев. - М.: Изд-во МГТУ, 1993. - 464 с.
3. Киселев А. А. Основы теории вейвлет-преобразования / А. А. Киселев. Режим доступа: http://www.BaseGroup.ru
4. Кумратова А. М. Выявление свойств прогнозируемости методами классической статистики / А. М. Кумратова // В сборнике: Актуальные проблемы социально-экономических исследований сборник материалов 6-й Международной научно-практической конференции. НИЦ «Апробация». 2014. С. 99-101.
5. Кумратова А. М. Исследование тренд-сезонных процессов методами классической статистики / А.М. Кумратова // Политематический сетевой электронный научный журнал КубГАУ. - 2014. - № 103. - С. 312-323.
6. Кумратова А. М. Методы искусственного интеллекта для принятия решений и прогнозирования поведения динамических систем / А. М. Кумратова // Политематический сетевой электронный научный журнал КубГАУ. - 2014. - № 103. -С. 324-341.
7. Кумратова А. М. Методы нелинейной динамики как основа построения двухуровневой модели прогноза / А. М. Кумратова // В сборнике: Экономическое прогнозирование: модели и методы материалы X международной научно-практической конференции. Воронеж, 2014. С. 169-174.
8. Кумратова А. М. Сопоставительный анализ прогноза урожайности для зон рискового земледелия / А. М. Кумратова // В сборнике: Экономическое прогнозирование: модели и методы материалы X международной научно-практической конференции. Воронеж, 2014. С. 174-179.
9. Кумратова А. М. Точный прогноз как эффективный способ снижения экономического риска агропромышленного комплекса / А. М. Кумратова // Политематический сетевой электронный научный журнал КубГАУ. - 2014. - № 103. -С. 293-311.
10. Попова Е. В. Рынок сахара: современные методы исследования динамики / Е. В. Попова, Т. М. Леншова, Д. Н. Савинская, С. А. Чижиков. - Краснодар: КубГАУ, - 2012.
References
1. Voshhinin A. P. Optimizacija v uslovijah neopredelennosti / A. P. Voshhinin, G. R. Sotirov. - M.: Finansy i statistika, 1989. - 400 s.
2. Kamaev V. D. Jekonomika i biznes / V. D. Kamaev. = M.: Izd-vo MGTU, 1993. = 464 s.
3. Kiselev A. A. Osnovy teorii vejvlet-preobrazovanija / A. A. Kiselev. Rezhim dostupa: http://www.BaseGroup.ru
4. Kumratova A. M. Vyjavlenie svojstv prognoziruemosti metodami klassicheskoj statistiki / A. M. Kumratova // V sbornike: Aktual'nye problemy social'no-jekonomicheskih issledovanij sbornik materialov 6-j Mezhdunarodnoj nauchno-prakticheskoj konferencii. NIC «Aprobacija». 2014. S. 99-101.
5. Kumratova A. M. Issledovanie trend-sezonnyh processov metodami klassicheskoj statistiki / A.M. Kumratova // Politematicheskij setevoj jelektronnyj nauchnyj zhurnal KubGAU. -2014. - № 103. - S. 312-323.
6. Kumratova A. M. Metody iskusstvennogo intellekta dlja prinjatija reshenij i prognozirovanija povedenija dinamicheskih sistem / A. M. Kumratova // Politematicheskij setevoj jelektronnyj nauchnyj zhurnal KubGAU. - 2014. - № 103. - S. 324-341.
7. Kumratova A. M. Metody nelinejnoj dinamiki kak osnova postroenija dvuhurovnevoj modeli prognoza / A. M. Kumratova // V sbornike: Jekonomicheskoe prognozirovanie: modeli i metody materialy X mezhdunarodnoj nauchno-prakticheskoj konferencii. Voronezh, 2014. S. 169-174.
8. Kumratova A. M. Sopostavitel'nyj analiz prognoza urozhajnosti dlja zon riskovogo zemledelija / A. M. Kumratova // V sbornike: Jekonomicheskoe prognozirovanie: modeli i metody materialy X mezhdunarodnoj nauchno-prakticheskoj konferencii. Voronezh, 2014. S. 174-179.
9. Kumratova A. M. Tochnyj prognoz kak jeffektivnyj sposob snizhenija jekonomicheskogo riska agropromyshlennogo kompleksa / A. M. Kumratova // Politematicheskij setevoj jelektronnyj nauchnyj zhurnal KubGAU. - 2014. - № 103. - S. 293-311.
10. Popova E. V. Rynok sahara: sovremennye metody issledovanija dinamiki / E. V. Popova, T. M. Lenshova, D. N. Savinskaja, S. A. Chizhikov. - Krasnodar: KubGAU, - 2012.