Научная статья на тему 'Управление обслуживанием мультипотока объектов в узловой рабочей зоне mobile-процессора'

Управление обслуживанием мультипотока объектов в узловой рабочей зоне mobile-процессора Текст научной статьи по специальности «Математика»

CC BY
89
24
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ДЕТЕРМИНИРОВАННЫЙ ПОТОК ОБЪЕКТОВ / ДИСКРЕТНАЯ МОДЕЛЬ ОДНОФАЗНОГО ОБСЛУЖИВАНИЯ / СИНТЕЗ ОПТИМАЛЬНО-КОМПРОМИССНЫХ СТРАТЕГИЙ / DETERMINISTIC FLOW OF OBJECTS / DISCRETE MODEL OF THE ONE-PHASE SERVICE / THE SYNTHESIS OF OPTIMAL COMPROMISE POLICIES

Аннотация научной статьи по математике, автор научной работы — Федосенко Юрий Семенович, Цветков Александр Игоревич

Рассматривается математическая модель однофазного обслуживания детерминированного мультипотока объектов, проходящих транзитом крупномасштабную узловую рабочую зону mobile-процессора. При оценке эффективности стратегии управления обслуживанием учитываются значения двух независимых критериев. Предлагается алгоритм синтеза оптимально-компромиссных стратегий обслуживания, реализующий в рамках концепции Парето идеологию динамического программирования. Приводятся примеры синтеза стратегий обслуживания. Модель описывает технологию дозаправки и других типов технического обслуживания на ходу автономно функционирующих подвижных объектов. Библиогр. 5. Ил. 4.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Федосенко Юрий Семенович, Цветков Александр Игоревич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

The mathematical one-phase servicing model for the deterministic multiflow of objects going through the large-scale nodal mobile-processor work area is considered. Values of two independent criteria have been taken into account when assessing the quality of the service control policy. The algorithm of the synthesis of optimal compromise service policies implementing a dynamic programming ideology within the Pareto concept is offered. The examples of service policy synthesis are given. The model describes the refueling technology and other types of technical service of moving objects which are in an autonomous mode of operation.

Текст научной работы на тему «Управление обслуживанием мультипотока объектов в узловой рабочей зоне mobile-процессора»

УДК 519.8 + 681.3

Ю. С. Федосенко, А. И. Цветков

УПРАВЛЕНИЕ ОБСЛУЖИВАНИЕМ МУЛЬТИПОТОКА ОБЪЕКТОВ В УЗЛОВОЙ РАБОЧЕЙ ЗОНЕ МОВ^Е-ПРОЦЕССОРА

Введение

Технология обслуживания судов на ходу при транзитном прохождении ими крупномасштабной зоны ответственности сервисного предприятия получает все большее распространение на внутреннем водном транспорте РФ. В качестве обслуживающего выступает специализированное судно, предназначенное для выполнения одного или некоторого фиксированного набора работ: материально-технического снабжения, сбора подсланиевых вод, ремонта и т. п.

Любое транзитное судно при прохождении зоны ответственности сервисного предприятия может запросить обслуживание, получить его или совсем не быть обслуженным в зависимости от складывающейся ситуации.

Одна из задач диспетчера сервисного предприятия (лица принимающего решения - ЛПР) заключается в выработке (и последующем обеспечении реализации) наиболее рациональной в конкретной оперативной обстановке стратегии обслуживания потока судов. С позиций повышения эффективности функционирования сервисного предприятия интерес представляют доходы от обслуживания судов. В то же время ЛПР стремится уменьшить общее количество необ-служенных судов, имеющих в общем случае различные приоритеты в обслуживании, что может выражаться в минимизации суммарного штрафа за отказы в обслуживании.

Особо отметим, что на практике, как правило, установлены достаточно жесткие ограничения на длительность формирования стратегий обслуживания. В силу этого актуальной является разработка быстрых (по условиям конкретного применения) алгоритмов синтеза.

Нами вводится обобщенная математическая модель обслуживания потока судов, проходящих транзитом многокомпонентную узловую область ответственности сервисного предприятия, и формулируется экстремальная задача синтеза стратегий обслуживания при наличии двух критериев оценки эффективности. Для решения указанной задачи предлагается алгоритм синтеза оптимально-компромиссных стратегий, реализующий в рамках концепции Парето [1] идеологию динамического программирования [2, 3]. Примеры реализации алгоритма и результаты вычислительных экспериментов приведены для моделей с двухкомпонентной (линейной) и трехкомпонентной зоной ответственности сервисного предприятия.

Математическая модель обслуживания

Аналогично [4] рассматривается «-элементный детерминированный мультипоток объектов О(п) = {о(1), о(2), ..., о(п)}, проходящих транзитом рабочую зону х шоЬйе-процессора Р. Зона х представляет собой состоящую из к ветвей узловую структуру (рис. 1), которая в дискретной идеализации представляет собой набор упорядоченных последовательностей элементарных участков с номерами 1, 2, ..., sq; при этом каждая последовательность соответствует

одной из ветвей зоны х ^ = 1, к).

Рис. 1. Узловая рабочая зона х шоЬіІе-процессора

Мультипоток О(п) считаем состоящим из к!/(к - 2)! подпотоков Оу таких, что

I \к!/(^“2)^ Пґ ч Г\к!/(^-2)и 0 х

^ ^ Оу- = О(п) и | | ^ Оу- = 0. Объекты каждого подпотока поступают в зону х

по некоторой ветви и покидают ее по другой ветви, проходя через узловую точку А; в пределах любой ветви зоны х перемещение объекта о(і) осуществляется равномерно.

Обслуживающий объекты мультипотока О(п) процессор Р характеризуется следующими целочисленными параметрами: и - номер ветви рабочей зоны, на которой расположен процессор Р в начальный момент времени ґ = 0; г - номер элементарного участка на ветви и, на котором расположен процессор P в момент ґ = 0; T-q (Г+д) - норма времени пребывания процессора P на элементарном участке при его автономном движении по д-й ветви рабочей зоны по направлению к точке А (от точки А), д = 1, к; м+(і) - доход за обслуживание объекта о(і), і = 1, п ;

м>~(і) - штраф за отказ в обслуживании объекта о(і), і = 1, п .

Каждый объект о(і) характеризуется следующими целочисленными параметрами: ґ(і) -момент поступления объекта в зону х; %-(і) (%+ (і)) - норма времени пребывания объекта на элементарном участке при движении по направлению к точке А (от точки А); сГ(і) (сҐ(і)) - номер ветви, по которой объект начинает движение в зоне х (покидает зону х), сГ(і) Ф сҐ(і); т(і) -норма длительности обслуживания объекта о(і) процессором Р.

Стратегия р обслуживания объектов мультипотока О(п) процессором Р представляет собой «-элементный (т є [0, п]) кортеж

Г(ФЬ Уь бДФ У 2, 02),...,(Фт, Ут, ^т ), при т > 1,

[0, при т = 0,

в записи которого использованы следующие обозначения: фу - идентификатор объекта о(фу), обслуживаемого процессором Р в очередь у (фу є [1, п], у = 1, т); уу - номер участка начала обслуживания объекта о(фу) в очередь у (уу є [1, .д, у = 1, т); 0у - номер ветви зоны х, на которой расположен участок начала обслуживания уу (0у = [1, к]),у = 1, т).

Совокупность всех допустимых (физически реализуемых) стратегий обслуживания р в дальнейшем будем обозначать через О.

Суммарный доход от обслуживания объектов мультипотока О(п) при реализации стратегии р обозначим через И+(р), а суммарный штраф за отказы в обслуживании объектов через ^(р). Как очевидно, указанные характеристики стратегии определяются выражениями

т т

ж+ (р)=2 ^+(фу), ж~ (р)=2 (фу).

у =1 у=1

Общий подход к исследованию проблемы принятия решений при наличии нескольких

критериев оценки базируется на концепции Парето [1] и в условиях рассматриваемой модели

приводит к следующей бикритериальной задаче

(шах(Ж + (р)), шіи(Ж_ (р))} (1)

рєО рєО

выделения в плоскости (^+(р), ^(р)) полной совокупности эффективных оценок с последующим построением соответствующих им оптимально-компромиссных (Парето-оптимальных [1]) стратегий обслуживания.

Для описания множества допустимых стратегий О в задаче (1) введем в рассмотрение следующие функции.

- ґО(і, х, д) - момент поступления объекта о(і) (і = 1, п) на участок с номером х (х є [1, .д]) ветви с номером д (дє [сТ(і), С (і)}), определяемый выражением

ґ (і, х, д) = <

Х (і)(.с-(і) - х) + ґ(і), д = С (і),

С- (і).С-(і) + Х+ (і)(х -1) + ґ(і), д = С + (і);

(2)

- ґр(ґ, у, р, х, д) - момент поступления процессора Р, находящегося в момент времени ґ на участке с номером у (у є [1, .р]) ветви с номером р (р є [1, к]), на участок с номером х (х є [1, .д]) ветви с номером д (д є [1, к]), вычисляемый по формуле

ґ (ґ, у, р, х, д) = <

Г+д(х - у) + Ґ, д = p, х > y,

Г-д (у - х) + ґ, д = р, х < у,

Г- ру + Г+ дх + ^ д * p,

- номер ветви, на которой в момент ґ находится объект о(і), определяемый равенством

С - (і), ґ < ґ (і) + с- (і. - (і),

(3)

дО (і, ґ )=<

С + (і), ґ > ґ(і) + с (і).

(4)

- хО(і, ґ) - номер участка, на котором в момент ґ находится объект о(і), определяемый по формуле

хО (і, ґ) = <

(ґ-ґ(і)-Х (і)у(і) )Д+ (і)

+1, ґ > ґ(і) + с (і).

С- (і)

(ґ -ґ(і))/% (і) 1 , ґ < Ґ(і) + С (і).

(5)

С- (і)

Символами [ ] и |" "| здесь обозначены операции округления с недостатком и с избытком соответственно [5].

Множество допустимых стратегий О определяется следующей системой ограничений: а) каждый объект о(ф/) в стратегии р может быть обслужен не более одного раза, т. е. при т > 1 для всех / ф g (/ = 1, т, g = 1, т) должно выполняться неравенство ф/ Ф фя; б) для всех объектов о(ф;) в стратегии р должно выполняться условие обслуживания в каждый момент времени не более одного объекта, т. е. ^(0, г, и, у1, 01) < tO(ф1, у1, 01), ^0(ф/-ь у/-1, 0/-1) + т(ф/-1),

х0(ф/Л^(ф/Л, уя, 0Я) + т(ф/-1)), у) < ^(ф/-ь у/-1, 0Я),/ > 2; в) обслуживание объекта должно начинаться и заканчиваться в пределах зоны х, т. е. 0/ е {сГ(ф/), сГ(ф/)}, у/ е {1, 2,..., ,^с-ф )}

(у е {1, 2, .„, Sс + (ф/)}Х x0(Ф/, у 0/) + ^(ф/-1)) < у(ф/,^(ф/,у/,0/)+Т(ф/)).

Построение решающего алгоритма

Мультипоток объектов О(п) и обслуживающий их процессор будем рассматривать как дискретную управляемую систему, на каждом этапе у управления которой для свободного процессора формируется вектор {иу, Оу, ^/}. Здесь иу - номер назначенного на обслуживание на этапе у объекта, Оу - номер участка начала его обслуживания, - номер ветви рабочей зоны, на ко-

торой начинается обслуживание объекта. Данный вектор будем называть управлением.

Как очевидно, состояние Ху рассматриваемой системы на у-м этапе управления характеризуется значениями набора характеристик ґпр, р, рд, L, где ґпр - момент принятия решения, р и рд -соответственно участок зоны х и номер ветви расположения освободившегося процессора Р, L - множество обслуженных на момент времени ґ объектов; состояние системы на начальном этапе обслуживания определяется набором Х0 = (0, г, и, 0).

Множество Ф(Ху) допустимых управлений {иу, оу, ^у} на у-м этапе может быть получено из соотношений (2)-(5) с учетом приведенных выше ограничений а) и в).

Для дальнейшего определим следующие операции.

1. Пусть х - произвольный вектор, а У - множество векторов той же размерности, что и вектор х. Тогда через х © У будем обозначать совокупность всех векторов V, представимых в виде V = х + у, где у є У.

2. Пусть М - произвольное множество двумерных векторов-оценок. Тогда через е//(М) будем обозначать максимальное по включению подмножество недоминируемых в М векторов.

Под действием управлений {и/, Ю/, Ц/} система переходит из состояния X/ в состояние

/ = и°(и, ю, Ц) + т(о), х°(и, ї° (и, ю, ц) + т(и)), д°(и, г° (и, ю, ц) + т(и)), Лии), которое позволяет обеспечить любую оценку из совокупности [(^+(ц/), ^_(и/)) © Б(Х/+1)]. Тогда

В(Х /) = е//

и [(»•>/■),*'-(«/■))© в(Х/+і)

{іи/, Ю/, ц/}єФ(X/)

(6)

На финальном этапе обслуживания к, переводящем систему в состояние, в котором последний объект покинул зону х, имеет место соотношение

В(Хк) = {(0, 0)}. (7)

Выражения (6)-(7) образуют рекуррентные соотношения динамического программирования, позволяющие реализовать синтез полной совокупности эффективных оценок и соответствующих им оптимально-компромиссных стратегий обслуживания.

Для реализации вычислений целесообразно сделать предварительную разметку, построив векторы допустимых управлений на каждом этапе обслуживания.

Результаты численных экспериментов

Пример 1. Для иллюстрации вычислительной процедуры рассмотрим решение задачи (1) для случая обслуживания бинарного потока объектов в узловой рабочей зоне при к = 2. Считаем, что система обслуживания характеризуется параметрами п = 3, 51 = 4, г = 3, и = 1, Т-1 = 2, Т+1 = 2, ^2 = 0, Т-2 = 0, Т+2 = 0; значения параметров объектов бинарного потока 0(3) приведены в табл. 1.

Таблица 1

Параметры объектов бинарного потока 0(3)

і «і) і(і) т ^(і) Х-(0 Х+(0 ™+(і) ™(і)

1 0 1 2 1 0 2 10 1

2 1 1 2 1 0 2 15 1

3 0 2 1 2 1 0 27 1

В результате предварительной разметки состояния и переходы между ними под действием управлений можно представить в виде дерева состояний (рис. 2).

Рис. 2. Дерево состояний

Характеристики состояний вычисляются в последовательности, соответствующей нумерации узлов дерева на рис. 2. Результаты разметки представлены в табл. 2.

Таблица 2

Результаты разметки в примере 1

І X {%, Ю, Ц} Номер узла І X {%, Ю, Ц} Номер узла

0 {0, 3, 1, 000} 0 1 {3, 1, 1, 001} {3, 2, 1} 6

1 {2, 2, 1, 100} {1, 2, 1} 1 1 {4, 3, 1, 100} {1, 3, 1} 7

2 {3, 2, 1, 110} {2, 2, 1} 2 2 {5, 3, 1, 110} {2, 3, 1} 8

2 {5, 3, 1, 110} {2, 3, 1} 3 2 {7, 4, 1, 110} {2, 4, 1} 9

2 {7, 4, 1, 110} {2, 4, 1} 4 1 {6, 4, 1, 100} {1, 4, 1} 10

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

1 {3, 2, 1, 010} {2, 2, 1} 5 2 {7, 4, 1, 110} {2, 4, 1} 11

Значения функции В(Х/) вычисляем, начиная с последнего этапа обслуживания В = (0, 0); ему соответствуют узлы с номерами 2, 3, 4, 5, 6, 8, 9, 11. Последовательно вычисляя значение В(Х) во всех узлах и запоминая управления, получим оценки В(Х1) = е/((0, 0) © (15, 1), (0, 0) © (15, 1), (0, 0) © (15, 1)) = (15, 1); Б(^) = е/((0, 0) © (15, 1), (0, 0) © (15, 1)) = (15, 1);

В(Хю) = е/((0, 0) © (15, 1)) = (15, 1); Б&) = е/((15, 1) © (10, 1), (15, 1), (27, 1), (15, 1) © (10, 1), (10, 1)) = е/((25, 2), (15, 1), (27, 1), (25, 2), (10, 1)) = ((25, 2), (27, 1)). В итоге получаем следующую полную совокупность эффективных оценок ((25, 2), (27, 1)) и соответствующие им оптимальные стратегии обслуживания {(1, 2, 1), (2, 2, 1)}, {(3, 2, 1)}.

Пример 2. Рассматривается процесс обслуживания объектов бинарного потока 0(15) с характеристиками к = 2, 51 = 20, и = 1, г = 10, Т-1 = 2, Т+1 = 2, 52 = 0, Т-2 = 0, Т+2 = 0; значения параметров объектов потока приведены в табл. 3.

Таблица 3

Характеристики объектов бинарного потока 0(15)

і Кі) Т(і) ‘Г® ‘+(і) С(і) С+(і) «’+(і) ™(і)

1 1 8 2 1 0 1 30 10

2 2 10 1 2 2 0 45 20

3 4 10 2 1 0 2 20 12

4 5 12 2 1 0 1 1 5

5 8 10 2 1 0 2 12 9

6 10 8 1 2 1 0 28 10

7 12 9 2 1 0 2 14 11

8 14 10 1 2 1 0 17 15

9 15 11 2 1 0 2 39 14

10 16 12 1 2 1 0 30 12

11 18 9 2 1 0 2 25 15

12 20 10 2 1 0 2 21 18

13 23 12 2 1 0 1 22 9

14 25 8 1 2 1 0 14 10

15 28 9 2 1 0 2 15 19

Полная совокупность эффективных оценок и соответствующие им оптимальнокомпромиссные стратегии обслуживания приведены в табл. 4. Продолжительность решения задачи синтеза на компьютере с процессором ЛМБ Типоп 1,8 ГГц составила 423 с.

Таблица 4

Полная совокупность эффективных оценок и оптимально-компромиссные стратегии в примере 2

(^+(р), №-(р)) Р

(143, 122) (1, 7, 1), (6, 15, 1), (9, 6, 1), (11, 11, 1), (12, 15, 1)

(108, 112) (1, 7, 1), (8, 16, 1), (11, 6, 1), (12, 10, 1), (15, 13, 1)

(132, 117) (1, 9, 1), (8, 17, 1), (9, 7, 1), (11, 12, 1), (12, 16, 1)

(126, 116) (1, 9, 1), (8, 17, 1), (9, 7, 1), (11, 12, 1), (15, 14, 1)

(122, 113) (1, 9, 1), (8, 17, 1), (9, 7, 1), (12, 11, 1), (15, 14, 1)

Для наглядности полная совокупность эффективных оценок представлена на рис. 3.

Рис. 3. Полная совокупность эффективных оценок в примере 2

Пример 3. Рассматривается процесс обслуживания объектов мультипотока 0(11) с характеристиками к = 3, ^ = 10, я2 = 12, я3 = 9, и = 1, г = 5, Т-1 = 1, Т-2 = 2, Т-3 = 2, Т+1 = 1, Т+2 = 1, Т+3 = 1; значения параметров объектов мультипотока приведены в табл. 5.

Таблица 5

Параметры объектов мультипотока 0(11)

і і(і) Т(і) ‘(і) сҐ(і) Х"(0 Х+(0 "+(0 ""(і)

1 1 6 1 2 1 4 30 10

2 4 8 1 3 2 3 45 20

3 8 5 2 1 3 4 20 12

4 10 6 3 2 2 3 21 5

5 15 4 1 2 2 4 12 9

6 18 6 2 3 3 4 28 10

7 20 9 3 2 2 3 14 11

8 22 8 1 2 1 3 17 15

9 24 6 2 1 2 3 39 14

10 28 5 3 2 2 4 30 12

11 30 4 1 3 1 2 25 15

Полная совокупность эффективных оценок и соответствующие им оптимальнокомпромиссные стратегии обслуживания приведены в табл. 6.

Полная совокупность эффективных оценок и оптимально-компромиссные стратегии в примере 3

Таблица 6

(Ж+(р), ^(р)) Р

(217, 40) (1, 3, 1), (2, 3, 1), (10, 3, 3), (11, 2, 1), (6, 1, 3), (3, 8, 1), (9, 10, 1)

(204, 37) (1, 8, 1), (2, 6, 1), (8, 6, 1), (11, 2, 1), (6, 1, 3), (3, 8, 1), (9, 10, 1)

(188, 36) (2, 11, 1), (5, 10, 1), (8, 9, 1), (10, 1, 3), (11, 3, 3), (3, 8, 1), (9, 10, 1)

Расположение совокупности эффективных оценок проиллюстрировано на рис. 4.

IV

40

39

38

37

36

35

180

і ™ (217,

І ф !

А (204\37)

( 188,36)

40)

190

200

210

IV

Рис. 4. Область эффективных оценок в примере 3

Заключение

Построена математическая модель обслуживания конечного детерминированного мультипотока объектов в многокомпонентной узловой рабочей зоне шоЬйе-процессора при наличии двух критериев оценки эффективности управления обслуживанием. Разработан алгоритм синтеза полной совокупности эффективных оценок и соответствующих им оптимальнокомпромиссных стратегий обслуживания. Приведены пример реализации алгоритма и результаты вычислительных экспериментов для двух- и трехкомпонентной узловых рабочих зон обслуживающего процессора, демонстрирующие возможность штатной реализации алгоритма в системах поддержки принятия решений при диспетчерском управлении транспортнотехнологическими процессами рассматриваемого типа.

СПИСОК ЛИТЕРАТУРЫ

1. Подиновский В. В., Ногин В. Д. Парето-оптимальные решения многокритериальных задач. -М.: Наука, 1982. - 255 с.

2. Беллман Р., Дрейфус С. Прикладные задачи динамического программирования. - М.: Наука, 1965. - 460 с.

3. Коган Д. И. Динамическое программирование и дискретная многокритериальная оптимизация. -Н. Новгород: Изд-во ННГУ, 2005. - 260 с.

4. Коган Д. И., Федосенко Ю. С., Шеянов А. В. Проблема синтеза оптимального расписания обслуживания бинарного потока объектов шоЬПе-процессором // Тр. III Междунар. конф. «Дискретные модели в теории управляющих систем», Москва, 1998 г. - М.: Изд-во МГУ им. М. В. Ломоносова, 1998. - С. 43-46.

5. Кнут Д., Грэхем Р., Паташник О. Конкретная математика. - М.: Изд-во Вильямс. 2010. - 784 с.

Статья поступила в редакцию 1.03.2011

CONTROL OF OBJECTS MULTIFLOW SERVICE IN THE NODAL WORK AREA OF THE MOBILE-PROCESSOR

Yu. S. Fedosenko, A. I. Tsvetkov

The mathematical one-phase servicing model for the deterministic multiflow of objects going through the large-scale nodal mobile-processor work area is considered. Values of two independent criteria have been taken into account when assessing the quality of the service control policy. The algorithm of the synthesis of optimal compromise service policies implementing a dynamic programming ideology within the Pareto concept is offered. The examples of service policy synthesis are given. The model describes the refueling technology and other types of technical service of moving objects which are in an autonomous mode of operation.

Key words: deterministic flow of objects, discrete model of the one-phase service, the synthesis of optimal compromise policies.

i Надоели баннеры? Вы всегда можете отключить рекламу.