УДК 351.862
ПРИМЕНЕНИЕ МЕТОДА ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ ДЛЯ РЕШЕНИЯ ЗАДАЧИ ОПРЕДЕЛЕНИЯ РАЦИОНАЛЬНОГО ПОРЯДКА
ПРОВЕДЕНИЯ РЕЭВАКУАЦИИ
А.И. Кузьмин
кандидат военных наук, профессор
профессор кафедры оперативного управления
мероприятиями РСЧС и ГО
Академия гражданской защиты МЧС России
Адрес: 141435, Московская обл.,
г. Химки, мкр. Новогорск.
E-mail: a-i-kuzmin2006Qyandex.ru;
Д.Н. Говоров
адъюнкт
Академия гражданской защиты МЧС России Адрес: 141435, Московская обл., г. Химки,мкр. Новогорск. E-mail: govorov-dnQyandex.ru;
Аннотация. В статье изложены основные положения реэвакуации населения, предложены новые термины и определения, характеризующие этот процесс. Представлен вариант решения методом динамического программирования задачи определения рационального порядка реэвакуации населения в стохастической постановке.
Ключевые слова: реэвакуация, защита населения, исследование операций, динамическое программирование, оптимизация.
Цитирование: Кузьмин А.И., Говоров Д.Н. Применение метода динамического программирования для решения задачи определения рационального порядка проведения реэвакуации. // Научные и образовательные проблемы гражданской защиты. 2018. № 2 (37). С. 27-31.
В существующем на сегодняшний день методическом, нормативном и научном обеспечении эвакуации подробно описан весь процесс применения данного способа защиты населения от момента её планирования до момента размещения эвакуированного населения в пунктах временного размещения (далее -ПВР) (пребывания (далее - ПДП)), установлены максимальные сроки нахождения людей в данных пунктах [1]. При этом единого подхода к пониманию каким образом и в каком порядке производить возвращение эвакуированных в места постоянного проживания по истечению этих сроков, либо по мере ликвидации последствий чрезвычайной ситуации и восстановления разрушенной инфраструктуры к настоящему времени не разработано.
В условиях отсутствия регламентирующих возвращение эвакуированного населения нормативов, методик и рекомендаций лицо, принимающее решение, вынуждено действовать, опираясь на собственные знания, опыт, предпочтения. При таком порядке работы возможно затягивание сроков возвращения, необоснованное увеличение затрат и т.п.
В течении всего периода нахождения вне мест постоянного проживания помимо расходов на содержание ПВР и ПДП (организа-
ция жизнеобеспечения, заработная плата администрациям и обслуживающему персоналу, оплата аренды помещений по договорам аренды и прочее) соответствующие органы власти (органы местного самоуправления) осуществляют выплаты компенсационного характера, в том числе и ежедневные.
И затраты эти довольно значительные, так при ликвидации последствий крупномасштабного наводнения в Дальневосточном федеральном округе на развёртывание и содержание пунктов временного проживания и питания для эвакуированных граждан было предусмотрено до 1 млрд. 267 млн. руб., а на выплаты пострадавшим гражданам было выделено до 12 млрд. 264 млн. руб. [2].
Кроме того, в целях возвращения населения в места постоянного проживания необходимо производить некоторый комплекс работ (в зависимости от результатов реализации негативного сценария) по ремонту, восстановлению объектов и систем разрушенной (поврежденной) инфраструктуры, что в свою очередь также приводит к значительным затратам.
Структура бюджета органа власти (местного самоуправления) предполагает, что финансирование всех трёх направлений (восста-
2018'2(37)
новление инфраструктуры, содержание ПВР (ПДП), компенсационные и ежедневные выплаты) производится с единой статьи финансирования. Ожидаемый дефицит денежных средств требует оптимального их распределения, что в свою очередь позволит максимально сократить сроки завершения реэвакуации.
Проведя анализ указанных направлений расходов, можно сделать вывод о том, что возможности сократить объёмы финансирования восстановительных работ отсутствуют, так как, ликвидируя последствия реализации негативного сценария необходимо привести инфраструктуру территории в состояние не хуже исходного по всем оцениваемым элементам.
Но если проводить реэвакуацию, то есть возвращение население из ПВР (ПДП), не после завершения всех восстановительных работ, а поэтапно, при этом на первом этапе переселить максимально возможно большую часть эвакуированных, то это позволит сократить затраты по оставшимся двум направлениям. Перераспределение «свободных денег» на дальнейшее восстановление инфраструктуры территории сократит (приблизит к нормативным) сроки проведения работ, а значит и сроки завершения реэвакуации.
Для решения задачи обоснования оптимального порядка проведения реэвакуации населения применим методы динамического программирования [3].
Итак, имеется физическая система (населённый пункт, на территорию которого необходимо реэвакуировать население) Е, которая с течением времени меняет своё состояние, то есть в системе Е происходит процесс выполнения восстановительных работ. Можно управлять этим процессом, то есть тем или другим способом влиять на состояние системы. Такая Е
а способ воздействия на неё - управлением и. При этом под управлением понимается не какая-то одна величина, а целая совокупность величин, векторов или функций, характеризующих управление.
С процессом управления связана определённая заинтересованность, выражающаяся численной величиной 5*пвр ^ ПОд КОторой следует подразумевать «выигрыш». То есть,
средства, которые необходимы для реэвакуации, будут определяться средствами, требуемыми для обеспечения пребывания населения в пунктах размещения (пребывания).
Необходимо так управлять процессом, чтобы выигрыш был минимален. Очевидно, что выигрыш зависит от управления
^ПВР _ д
пвр
(и).
(1)
Необходимо найти такое управление (оптимальное), при котором выигрыш будет минимальным:
5
ПВР
_ тгп{Б11аци)},
(2)
где и - множество возможных управленческих решений по выбору административной единицы.
Следовательно, рациональное управление процессом реэвакуации будет определяться порядком восстановления административных единиц, который обеспечивает минимизацию средств, требуемых для содержания эвакуированного населения в пунктах размещения (пребывания).
Будем считать, что административные единицы восстанавливаются последовательно.
Обозначим через:
Ег+1 _ - состояние территории
реэвакуации после реализации управления и^
д^пвр _ сокращение средств, выделяемых на содержание эвакуированного населения в пунктах размещения (пребывания).
Тогда целевая функция имеет вид:
_ тт{А*'(Ег,иг) +
и
+5™1Р (<Рг(Ег,щ))},
где т _ т(Ег), и _ , Ет)
мальное управление процессом на г-м шаге;
Е» - состояние территории реэвакуации на ^ момент времени.
Для геометрической интерпретации процесса управления введём понятие о так называемом фазовом пространстве.
В нашем случае состояние Е системы X, которой можно описать с помощью комбинации из некоторого числа административных единиц. Эти комбинации будем называть фазовыми координатами системы X.
(3)
опти-
Говоров Д.Н., Кузьмин А.И.
Так как состояние нашей системы X характеризуется ] административными единицами, то фазовым пространством будет мерное пространство или его часть, а управляемый процесс изобразится перемещением точки Е по пространственной кривой.
Тогда задача оптимизации управления в геометрических терминах будет сформулирована следующим образом: найти такое управление и (оптимальное управление), под влиянием которого точка Е фазового пространства переместится из начальной области Ео в конечную область Еш , так, что при этом выигрыш 5*пвр обратится в минимум.
Для динамического программирования характерным является следующий методический приём: процесс перемещения точки Е из Ео в Еш разделяется на несколько шагов (этапов), и затем проводится пошаговая оптимизация управления и выигрыша.
Процедура построения оптимального управления методом динамического программирования распадается на две стадии: предварительную и окончательную. На предварительной стадии определяется для каждого шага условное оптимальное управление, зависящее от состояния Е системы (достигнутого в результате предыдущих шагов), и условный оптимальный выигрыш на всех оставшихся шагах, начиная с данного, также зависящий от состояния Е.
На окончательной стадии определяется для каждого шага окончательное (безусловное) оптимальное управление.
Предварительная (условная) оптимизация производится по шагам, в обратном порядке: от последнего шага к первому; окончательная (безусловная) оптимизация - также по шагам, но в естественном порядке: от первого шага к последнему.
Из двух стадий оптимизации несравненно более важной и трудоёмкой является первая. После окончания первой стадии выполнение второй трудности не представляет: остаётся только «прочесть» рекомендации, уже заготовленные на первой стадии.
В основе поэтапной процедуры лежит принцип оптимальности, который состоит в следующем: каково бы ни было состояние Е
системы в результате какого-то числа шагов, мы должны выбирать управление на ближайшем шаге так, чтобы оно, в совокупности с оптимальным управлением на всех последующих шагах, приводило к минимальному выигрышу на всех оставшихся шагах, включая данный.
Рассматриваемые нами административные единицы характеризуются двумя показателями:
ёмкостью (Nj) - численностью эвакуированного (проживающего) населения, чел.;
сроком восстановления (Аtj), сут.
Перепишем формулу 3 в следующем виде:
SnBP = sJ N1At1 +
(4)
^ min ,
Nk Atk
где 5"пвр - средства, затраченные на содержание реэвакуируемых в ПВР до времени окончания процесса реэвакуации, руб
So(NkА^) - значение средств, затрачиваемых на содержание эвакуированных в ПВР, руб.;
So - средства, затрачиваемые на содержание одного человека в сутки, руб.;
N1 = Y^^к - численность реэвакуируемого населения на начальном этапе реэвакуации, чел.;
Nk-i — Пк-1 — численность реэвакуируемого населения в ПВР на к-м этапе реэвакуации, чел., к = 2,... ,т; N1 = N-,
Пк-1 — численность возвращаемого в места постоянного проживания населения на к-м этапе реэвакуации, чел., получаемая по данным учёта (паспортные столы, домовые книги и пр.);
Nj - ёмкость j-й административной территории, чел.;
Atk ~ срок восстановления административной единицы на к-м этапе реэвакуации, сут., получаемый по оценкам экспертов.
Для достижения минимального выигрыша в такой постановке необходимо, чтобы на каждом этапе реэвакуации численность переселяемого населения Пк ^ тах, при сроке восстановления Atk ^ min
+ ¿(Wfc-i — nk-i)Atk\
2018'2(37)
Решение описанной выше задачи в детерминированной постановке поставлено в жесткие рамки, которые не позволяют учитывать возможное влияние различных факторов на процесс реэвакуации.
Так, например, ёмкость административной единицы (число первоначально эвакуированных) может измениться по следующим причинам:
неточности статистического учёта (домовые книги, паспортные столы и т.д.);
естественная миграция населения;
отказ части эвакуированных от возвращения;
обеспечение части населения жилищными сертификатами.
Соответственно, подвержены «колебаниям» и сроки восстановления административных единиц.
Для учёта этих «колебаний», необходимо решать эту задачу в стохастической постановке.
В качестве исходных данных будем считать, что ёмкость ]-т административной единицы и сроки восстановления ]-т административной единицы являются математическими ожиданиями случайных величин, распределённых по нормальному закону. Также установим средние квадратические отклонения для них: аПк-1 _ 0,01пк-1,(ГАгк _ 0,1АЬк.
Соответственно и значение средств, затрачиваемых на содержание эвакуированных в ПВР, представлены как случайные величины, принимающие значения с вероятностью = 0,95
В связи с отсутствием достаточного объема статистики проведения реэвакуационных мероприятий, требуется применить метод Монте-Карло (метод моделирования слу-
чайных величин с целью вычисления характеристик их распределений) [4]. Объём выборки определим - 100. Для просчёта всех возможных комбинаций и выбора оптимальной по критерию наибольшей экономии денежных средств на содержание эвакуированного населения в пунктах размещения (пребывания) написана программа на языке программирования Pascal, в основу положен алгоритм ветвей и границ, основным достоинством которого является универсальность и простота реализации его на электронно-вычислительных машинах [5]. Расчёт производился при условии последовательного восстановления районов.
В результате получим математическое ожидание, отражающее затраченные средства на содержание населения в ПВР (ПДП) с заданной доверительной вероятностью (0,95), средним квадратическим отклонением
О П 1 оПВР
3(7 = 0,1о , для которой также определим границы доверительного интервала.
Применение метода динамического программирования для решения задачи определения рационального порядка проведения реэвакуации в значительной степени сокращает время на принятие решения. Так для получения оптимального решения для 5 административных единиц методом перебора потребуется просчитать 120 комбинаций, для 10 административных единиц количество комбинаций составит уже 3628800. Предложенный вариант решения задачи, реализованный в виде компьютерной программы на 8-10 шаге выбора комбинации (для 5 административных единиц) выдаёт требуемый рациональный результат.
Литература
1. Мазаник А.И., Сулима Т.Г. Методика определения рационального перечня и количества образцов военной и специальной техники оборудования, имущества, снаряжения и экипировки для оснащения спасательного воинского формирования МЧС России. "Научные и образовательные проблемы гражданской защиты". 2017 №1 (32). С. 3-6
2. Катастрофическое наводнение 2013 года в Дальневосточном федеральном округе. Том I. Уроки и выводы: Научно-методический труд /МЧС России. М.: ФГБУ ВНИИ ГОЧС (ФЦ), 2013. - 180 с.
3. Вентцель Е.С. Исследование операций. М., «Советское радио», 1972. - 552 с.
Говоров Д.Н., Кузьмин А.И.
4. Н. П. Бусленко, Ю. А. Шрейдер. Метод статистических испытаний (Монте-Карло) и его реализация на цифровых вычислительных машинах. — М.: Государственное издательство физико-математической литературы, 1961 г. — 226 с.
5. Ковалев М.М. Дискретная оптимизация. - Минск, БГУ, 1977. - 192 с.
APPLICATION OF THE DYNAMIC PROGRAMMING METHOD FOR SOLVING THE PROBLEM OF DETERMINING THE RATIONAL ORDER OF REVAKUATION PROCEDURE
Alexandr KUZMIN
Candidate of Military Sciences, Professor
Professor Department of Operational Management
of Activities of RSCHS and GO
Academy of Civil Defence EMERCOM of Russia
Address: 141435, Moscow Region,
Khimki, md. Novogorsk.
E-mail: a-i-kuzmin2006Clyandex.ru
Denis GOVOROV
Adjunct
Academy of Civil Defence EMERCOM of Russia Address: 141435, Moscow Region, Khimki, md. Novogorsk. E-mail: govorov-dnQyandex.ru
Abstract. The article outlines the main provisions for the re-evacuation of the population, proposed new terms and definitions that characterize this process. A variant of solving the problem of determining the rational order of population re-evacuation in a stochastic formulation by the method of dynamic programming is presented.
Keywords: re-evacuation, population protection, operations research, dynamic programming, optimization.
Citation: Kuzmin A.I., Govorov D.N. (2018) Primeneniye metoda dinamicheskogo programmirovaniya dlya resheniya zadachi opredeleniya ratsional'nogo poryadka provedeniya reevakuatsii [Application of the dynamic programming method for solving the problem of determining the rational order of revakuation procedure]. Scientific and educational problems of civil protection, no. 2 (37), pp. 27-31 (in Russian).
References
1. Mazanik A.I., Sulima T.G. Metodika opredeleniya ratsional'nogo perechnya i kolichestva obraztsov voyennoy i spetsial'noy tekhniki oborudovaniya, imushchestva, snaryazheniya i ekipirovki dlya osnashcheniya spasatel'nogo voinskogo formirovaniya MCHS Rossii. "Nauchnyye i obrazovatel'nyye problemy grazhdanskoy zashchity". 2017 №1 (32). S. 3-6
2. Katastroficheskoye navodneniye 2013 goda v Dal'nevostochnom federal'nom okruge. Tom I. Uroki i vyvody: Nauchno-metodicheskiy trud /MCHS Rossii. M.: FGBIJ VNII GOCHS (FTS), 2013. - 180 s.
3. Ventsel' Ye.S. Issledovaniye operatsiy. M., «Sovetskoye radio», 1972. - 552 s.
4. N. P. Buslenko, YU. A. Shreyder. Metod statisticheskikh ispytaniy (Monte-Karlo) i yego realizatsiya na tsifrovykh vychislitel'nykh mashinakh. — M.: Gosudarstvennoye izdatel'stvo fiziko-matematicheskoy literatury, 1961 g. — 226 s.
5. Kovalev M.M. Diskretnaya optimizatsiya. - Minsk, BGU, 1977. - 192 s.