А.В. Меньших,
Воронежский институт ГПС МЧС России
С.Н. Тростянский,
доктор технических наук, доцент, Воронежский институт ГПС МЧС России
МОДЕЛИРОВАНИЕ СТРУКТУРЫ ВРЕМЕННЫХ РЯДОВ ПОЖАРНОЙ СТАТИСТИКИ
MODELLING OF THE STRUCTURE OF TIME SERIES OF FIRE STATISTICS
Рассматриваются временные ряды пожарной статистики. Описываются математические методы выявления структуры и прогноза будущих значений временных рядов, включающих трендовую, циклические и случайную компоненты. Приводится численный пример анализа структуры временного ряда, содержащего данные о количестве пожаров в Воронежской области с 2000 года.
The time series of fire statistics are considered. We describe mathematical methods of exposing the structure and prognosis of the future value of time series, including trend, periodic and random components. There is a numerical example of analysis the structure of time series comprises the data about the number of fire in Voronezh region since 2000.
Как свидетельствует мировая статистика, ежегодно в пожарах около 65 тысяч человек погибают, а около 300 тысяч получают различные травмы, материальный ущерб составляет сотни миллиардов долларов [1, 2]. Особенно драматична ситуация в России, где за год в среднем погибают 20 тысяч человек, столько же травмируются, а экономический ущерб составляет до 180 миллиардов рублей. Причем эти потери возрастают с каждым годом [2, 3]. По мнению ведущих специалистов, решать проблемы пожарной безопасности невозможно без привлечения всего научного потенциала, результатов фундаментальных и прикладных исследований [2, 4]. Одним из таких направлений исследований является повышение эффективности принятия управленческих решений.
Большое значение при принятии управленческих решений в государственной противопожарной службе имеет анализ пожарной статистики [1, 5], который может быть использован как в интересах выявления факторов, влияющих на показатели пожарной статистики, так и в интересах прогноза их будущих значений. Такой анализ может быть осуществлен на основе математического моделирования показателей пожарной статистики, чему и посвящена настоящая работа.
Формализация пожарной статистики
Пожарная статистика представляет собой совокупность значений отдельных статистических показателей, каждый из которых представляет собой интервальный временной (динамический) ряд вида
страдавших и т.д.) за интервал времени Т.
Значения показателей формируются вследствие влияния большого количества факторов. При моделировании временных рядов факторы обычно делят на следующие группы [5—7]:
Введение
1) факторы, оказывающие долговременное влияние на значения показателя; результат их совокупного влияния называют трендовой компонентой временного ряда
T = ^1Л2,...,е);
2) факторы, отражающие повторяющиеся процессы в течение некоторых периодов времени; результаты их влияния называют циклическими компонентами временного ряда С1 ,С2,...,Cm, где Ci = (с’,с2,...,сП ), / = 1,2,...,m ,; каждая циклическая компонента имеет собственный период изменения, за время которого её влияние компенсируется;
3) факторы, не учтенные в указанных ранее группах; результат их совокупного влияния называют случайной компонентой временного ряда E = (е1 ,е2 ,...,en).
Модель временного ряда (1) представляют как функцию перечисленных компонент :
Y = F(1,0! ,С2 ,...,Сп,Е). (2)
Первой задачей, которую необходимо решить при выявлении структуры временного ряда (1), является определение вида функциональной зависимости (2). Наиболее часто в статистике используют аддитивную Y = Т + С1 + С2 +... + Ст + Е или мультипликативную Y = Т ■ С1 • С2 • ...• Ст ■ Е модели ряда. Определение типа модели основано на использовании функции автокорреляции.
Обозначим гк = ^к) — коэффициент корреляции исходного ряда (1) и ря-
да Yk , полученного из исходного сдвигом на к уровней. Непосредственной проверкой определим значение г = тах\гк\. Если г* близок к 1, то это свидетельствует о наличии
автокорреляции уровней ряда [6—8].
Обозначим
к* = Л^таХгк\. (3)
Разобьем множество уровней ряда на непересекающиеся отрезки, включающие к* уровней ряда и найдем амплитуду изменения уровней ряда в каждом периоде. Если последовательность амплитуд является монотонной (безразлично — возрастающей или убывающей), то целесообразно осуществлять построение мультипликативной модели, иначе — аддитивной [8].
Обратимся к нахождению значений отдельных компонент.
Выделение отдельных циклических компонент
Для нахождения отдельной циклической компоненты может быть использован метод скользящей средней [8]. Его суть заключается в следующем.
Пусть по формуле (3) найдено значение к*. Если к* > 1, то можно сделать вывод о наличии циклической компоненты с периодом, включающим к* уровней ряда; если к* = 1, то ряд включает только трендовую компоненту.
Первоначально находим скользящие средние по формуле
1 к* к* к* +к* 1 т------------- Т--------------------+1 Т+-1 1 Т+-
2 I 2 , 2 2
у 2 + у 2 +... + у 2 +—у 2 ,айёе к* ^аой
т = 2 2
У пеТё ") ^
■ * * Ж Ж
к -1 к +1 к -1 к -1
т------------ т--------------------- т+---------Т+
^у 2 + у 2 +... + у 2 + у 2 ,айёе к 1а^аой .
После этого для каждого уровня находим средние значения скользящих средних для каждого уровня одного периода:
~1 ,~2 ,...,~к. . (4)
Полученные значения (4) представляют собой оценки циклической компоненты. Для нахождения точных значений необходимо преобразовать эти оценки в оценки
%У'г ’-’К' (5)
к к
так, чтобы выполнялось свойство ^ у'т = 0 — для аддитивной модели и П УТ = 1 — для
Т=1 Т=1
мультипликативной модели. Значения (5) могут быть найдены по формулам
к*
Г Ут
Т=1 «
ут = ут - т 1 * — для аддитивной модели,
к
Ут
у т = —;=== — для мультипликативной модели.
После этого значения циклической компоненты С1 находим по формуле = У'т{тойк'), где т{шейк*) — остаток от деления т на к*.
Выделение трендовой и случайной компонент
После циклических компонент находим трендовую компоненту. Для этого из уровней ряда исключаются значения циклических компонент по формулам
т
уТ = уТ -^сТ — для аддитивной модели,
1=1
Лт уТ
ут = —— — для мультипликативной модели.
Пт с1 1=1
Нахождение трендовой компоненты осуществляется методом аналитического выравнивания, под которым понимается построение уравнения парной регрессии значений 2
й ¥ =(5Л1 ,у2 ,...,уп ) по номерам уровней ряда. Как правило, при анализе
структуры временных рядов пожарной статистики достаточно использовать линейную регрессию уТ = аг + ЬГ1Т + еТ. При этом могут быть выведены значения трендовой компоненты Т = (?1Д2 ,...’1п) и найдены значения случайной компоненты по формулам
ет = ут - 1Т — для аддитивной модели;
т ут
е т = -— — для мультипликативной модели.
Полученные формулы позволяют в явном виде находить прогнозируемые значения временного ряда по формулам:
т У
ут+" = а + ЬТ (т+х у'(т+„ )(тойк*) — для аддитивной модели,
i,(t+s )(mod к*) m
yt+s = (aY + bY (t + S))'П y'{t+s^modk') -ДЛЯ мультипликативной модели,
где к* и y'. (t+s)(modk*) — соответствующие параметры для циклической компоненты C..
Описанная процедура полностью реализована в статистическом пакете Microsoft Excel и позволяет находить структуру любого временного ряда пожарной статистики, а также осуществлять прогноз изменения этих временных рядов [9, 10].
Виды циклических компонент
В структуре временного ряда может выделяться несколько циклических компонент, каждая из которых описывает влияние факторов, отражающих повторяющиеся
процессы в течение различных периодов времени. Действие циклических компонент накладывается друг на друга, они могут диссонировать (если периоды некратны друг другу) или резонировать (в случае кратности периодов), что значительно усложняет процесс их выявления. Задача может быть несколько упрощена, если на основе анализа предметной области удается предположить существование циклических компонент определенного типа. Анализ пожарной статистики показал, что временные ряды могут включать, по крайней мере, два типа циклических компонент.
Во-первых, в силу природы пожарной статистики в ней, как правило, присутствует циклическая компонента £ = (у1 2’...,уп), отражающая повторяющиеся процессы (погодные условия и обусловленные ими условия хозяйственной и иной деятельности людей) в течение одного календарного года. Такую циклическую компоненту обычно называют сезонной.
Для поиска других компонент необходимо исключить сезонную компоненту. Это может быть достигнуто переходом к рассмотрению погодовой статистики, когда результаты сезонных колебаний взаимно компенсируются.
Анализ особенностей формирования пожарной статистики позволяет выдвинуть гипотезу о том, что на значения временного ряда У может оказывать влияние ещё одна компонента Р = (р1 ,р2,...,рп), которая отражает реакцию должностных лиц, ответственных за противопожарную безопасность, и населения на информацию о количестве пожаров, произошедших в предыдущие интервалы времени, и экономический ущерб от них.
Очевидно, что чем больше пожаров, тем более строгим становится соблюдение мер противопожарной безопасности, и следовательно, компонента Р отражает эффект снижения количества пожаров. Напротив, чем меньше пожаров, тем в большей степени теряется бдительность, и данная компонента отражает эффект увеличения количества пожаров. В связи с тем что периоды снижения и увеличения количества пожаров сменяют друг друга, можно предположить циклический или близкий к циклическому характер этой компоненты. Её проявление тем существеннее, чем неравномернее изменение уровней временного ряда. Учитывая природу компоненты, будем называть её ин-фор мационно-психологической.
Численные примеры моделирования временных рядов пожарной статистики
Приведем результаты выявления структуры временного ряда пожарной статистики в Воронежской области за 2000—2010 годы и их использование для прогноза будущих значений ряда.
Данные содержат количественные характеристики статистических показателей за целый год, что обеспечивает отсутствие сезонной компоненты. Поэтому можно считать, что модель динамики представляется в виде У = Г (Т,Р,Е). В качестве примера рассмотрим ряд, описывающий общее количество пожаров в области [11] (табл. 1).
Таблица 1
т 2000 2001 2002 2003 2004 2005 2006 2007 200 2009 2010
ут 3815 3694 3690 3346 3281 3257 3224 3094 3045 2981 2952
Результаты вычисления автокорреляционной функции (табл. 2) показали существование авторегрессии и циклический характер изменения временного ряда с периодом в 4 уровня.
Таблица 2
Коэффициент корреляции Г1 Г2 Г3 Г4 Г5 г6
Значение коэффициента 0,942 0,905 0,934 0,976 0,930 0,901
Неравномерность амплитуды изменения уровней ряда в каждом периоде является основанием для выбора аддитивной модели ряда У = Т + Р + Е [11]. Для нахождения значений информационно-психологической компоненты использовали метод скользящей средней, а трендовой компоненты — аналитического выравнивания [8] (табл. 3).
Таблица 3
т 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010
РТ -81,5 -29,6 101,9 9,2 -81,5 -29,6 101,9 9,2 -81,5 29,6 101,9
3772,3 3679,4 3586,6 3493,7 3400,9 3308,0 3215,2 3122,3 3029,5 2936,6 2843,8
В частности, при нахождении трендовой компоненты было построено статистически значимое уравнение линейной парной регрессии, позволяющее прогнозировать последующие значения уровней ряда: гт = 3865,09 - 92,84(т-1999)+ ет.
Используя данное уравнение, а также значения информационно-психологической компоненты рт, осуществили прогноз последующих значений (результаты
приведены на рисунке), для наглядности оставлены значения исходных данных.
'1£НХ>
МЮО
1ЛХ>
.няк*
14<Х>
инх>
.кк.хк
г«»
гвоо
упю
длху
гда
¿ХХГ
ггоо
2100
лкх>
Известные и прогнозируемые значения временного ряда
Следует отметить, что аналогичные зависимости были получены и при анализе других характеристик пожарной статистики. Особо важно, что всегда выявлялась носящая циклический характер компонента с периодом в 4 уровня ряда. Данное обстоятельство можно считать подтверждением существования информационно-психологической компоненты.
Заключение
Данный прогноз выполнен на основе анализа лишь 11 известных уровней временного ряда и, следовательно, является приблизительным. Вместе с тем, сравнение прогнозируемого значения на 2011 год (2760) с реальным значением (2658) показывает, что относительная погрешность составляет менее 4%, что свидетельствует о достаточной эффективности описанного в работе метода. По мере накопления статистических данных прогноз может быть существенно уточнен. Кроме того, требует дальнейших
исследований выявленная стабильность четырехлетнего периода изменения информационно-психологической компоненты.
ЛИТЕРАТУРА
1. Брушлинский Н.Н. Системный анализ деятельности Государственной противопожарной службы. — М.: МИПБ МВД РФ, «Юникс», 1998. — 255 с.
2. Белозеров В.В., Богуславский Е.И., Топольский Н.Г. Модель оптимизации социально-экономических потерь от пожаров // Проблемы информационной экономики. Вып. VI. Моделирование инновационных процессов и экономической динамики: сб. науч. трудов / под ред. Р.М. Нижегородова. — М.: Ленанд, 2006. — С. 226—246.
3. Методология оценки и управления безопасностью техносферы / П.П. Баранов [и др.] // Техносферная безопасность: сб. материалов 7-й Всероссийской научнопрактической конференции. — Ростов н/Д: ЮРО РААСН (РГСУ), 2002. — С. 67—73.
4. Богуславский Е.И., Белозеров В.В., Богуславский Н.Е. Прогнозирование, анализ и оценка пожарной безопасности: учебное пособие / под общ. ред. Е. И. Богуславского. — Ростов н/Д: РГСУ, 2004. — 126 с.
5. Акимов В .А., Быков А. А., Щетинин Е. Ю. Введение в статистику экстремальных значений и ее приложения. — М.: ФГУ ВНИИ ГОЧС (ФЦ), 2009. — 524 с.
6. Кремер Н.Ш. Теория вероятностей и математическая статистика. — М.: ЮНИТИ-ДАНА, 2009. — 551 с.
7. Кремер Н. Ш., Путко Б.А. Эконометрика / под ред. проф. Н. Ш. Кремера. — М.: ЮНИТИ-ДАНА, 2007. — 311 с.
8. Эконометрика / под ред. И.И. Елисеевой. — М.: Проспект, 2011. — 288 с.
9. Меньших А.В. Компьютерная модель выявления структуры пожарной статистики // Математические методы и информационно-технические средства: труды VIII Всероссийской научно-практической конференции. 22—23 июня 2012 г. — Краснодар: Краснодарский университет МВД России, 2012. — С. 132—134.
10. Меньших А.В. Обоснование общего вида авторегрессионной модели динамики пожаров // Человек. Природа. Общество. Актуальные проблемы: материалы Международной молодежной конференции. — Воронеж: Научная книга, 2012. — С. 68—70.
11. Тростянский С.Н., Шуткин А.Н., Бакаева Г. А. Экономический подход к прогнозированию пожарных рисков на объектах различных форм собственности // Вестник Воронежского института Государственной противопожарной службы МЧС России. — 2011. — №1. — С. 27—29.